3,629 repos GH 3,514 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
全AIリポジトリ
登録されているAI関連OSSの一覧
音声生成 / TTS GitHub Cartesia
Cartesiaは、tryAGIが提供する低遅延のText-to-Speech (TTS)、Speech-to-Text (STT)、音声クローニング、AIエージェ…
★ 1 MIT 2026-06-23
マルチモーダル GitHub PrismRAG
PrismRAGは、PDFドキュメント内のテキストだけでなく、図、チャート、テーブルといった視覚情報からも質問に答えるマ…
★ 1 MIT 2026-06-20
動画生成 GitHub Comic-drama
「Comic Drama Workflow」は、AIを活用してスクリプトからコミックドラマを制作するオープンソースのツールです。ス…
★ 1 MIT 2026-06-07
AIエージェント GitHub cell-mem
Cell-memは、AIエージェント向けに脳にインスパイアされた多層的な永続メモリシステムです。作業記憶、エピソード記…
★ 1 MIT 2026-06-09
音声生成 / TTS GitHub sympho
SymphoはElevenLabs.ioを基盤とした、オープンソースで高性能なAI音声生成ソリューションです。テキストからスピーチ…
★ 1 2025-09-13
マルチモーダル GitHub ai-chef-multimodal-assistant
AI Chefは、自宅にある食材からレシピを生成するAI搭載のマルチモーダル料理アシスタントです。テキスト入力または食…
★ 1 2026-06-09
マルチモーダル GitHub Wally-like-Storytelling-Scene-Interactor
この「Wally-like Storytelling Scene Interactor」は、テキストを基に画像を生成し、その画像内の特定の領域をマス…
★ 1 2025-08-12
LLM GitHub Content-Vigilante
Content Vigilanteは、ブランドガイドと対象コンテンツをもとに、文章がブランドの文体や語彙、構成、読みやすさに合…
★ 1 MIT 2026-06-22
ASR / 音声認識 GitHub ClearWord
ClearWordは、AIを搭載した会話回復エージェントであり、聴覚に困難を抱える人々が会話で聞き逃した部分を理解するの…
★ 1 MIT 2026-06-11
LLM GitHub scrape-website-mcp
scrape-website-mcpは、ウェブサイトを高性能にスクレイピングし、クリーンなMarkdown形式でコンテンツを抽出するセ…
★ 1 MIT 2026-05-12
マルチモーダル GitHub mlx-mtp
mlx-mtpは、Apple Silicon上で大規模なVision-Language Models (VLM) を高速かつローカルで実行するために設計された…
★ 1 Apache-2.0 2026-06-16
音楽生成 GitHub musical-doodle
「Ratio Engine (Musical Doodle)」は、Web AudioとPythonを組み合わせた、数学にインスパイアされたインタラクティ…
★ 1 2026-04-07
LLM GitHub model-monitor
「模型 API 监控工具」は、OpenAI、DeepSeek、MiMoなど、複数のモデルAPIの利用状況をリアルタイムで監視・管理する…
★ 1 MIT 2026-06-25
画像生成 GitHub nano-banana-2-api
APIDotのNano Banana 2 APIは、GoogleのGemini 3.1 Flash Imageモデルを活用し、高速で高品質な画像生成と自然言語に…
★ 1 MIT 2026-05-25
LLM GitHub local-ai-research-assistant
このツールは、OllamaなどのローカルLLM、ウェブ検索、コンテンツ抽出、および構造化レポート生成を活用した自律的な…
★ 1 MIT 2026-05-14
画像生成 GitHub contextlm
contextlmは、ハードウェアを意識したAIモデル発見のためのターミナルツールです。CPU/GPU/NPUを詳細にプローブし、9…
★ 1 MIT 2026-06-06
LLM GitHub hivelink
HiveLinkは、Mac、Windows、Linux、NVIDIA、AMD、Apple Siliconといった多様なデバイスを統合し、大規模な言語モデル…
★ 1 MIT 2026-06-23
3D / NeRF GitHub comfyui-3D-viewport
ComfyUIワークフロー向けに設計された、ネイティブOpenGL 3Dビューポートです。物理カメラに忠実な表現が可能で、深…
★ 1 2026-05-15
ASR / 音声認識 GitHub Welcome-to-the-Narthex-Transcripts
このツールは「Welcome to the Narthex」ポッドキャストのエピソードから、OpenAI Whisperでトランスクリプト(文字…
★ 1 NOASSERTION 2026-05-27
3D / NeRF GitHub Gaussian-Splatting
本プロジェクトは、現実世界の画像データから3D Gaussian Splatting技術を用いてTH OWLキャンパスの建物を高精度に再…
★ 1 2026-05-27
AIエージェント GitHub collab-finder
collab-finderは、X(旧Twitter)上で仕事、コラボレーション、副業、コミュニティ構築の機会を自律的に発見するため…
★ 1 2026-06-11
音楽生成 GitHub kithairon
Kithaironは、モノフォニックなメロディから演奏可能で説明可能なカノンのバリアントを生成するシンボリック音楽コン…
★ 1 Apache-2.0 2026-05-21
3D / NeRF GitHub MultiBEST—Multiscale-Multiphase-Bridging-Experiment-and-Simulation-Toolkit
MultiBESTは、実験で得られた2D顕微鏡写真、2D/3D EBSDデータ、またはユーザーのスケッチから、原子レベルおよび連続…
★ 1 GPL-3.0 2026-06-09
ComfyUI GitHub ComfyUI-Selective-Sigma-Detailer
ComfyUI-Selective-Sigma-Detailerは、画像生成AI「ComfyUI」用のカスタムサンプラーです。サンプリングの途中で、画…
★ 1 ⑂ 3 MIT 2026-05-10