LLM GitHub prompts.chat
prompts.chatは、ChatGPTをはじめClaude、Gemini、Llama、Mistralなど複数のAIチャットモデルで使えるプロンプトを集…
★ 164.4k ⑂ 21.3k NOASSERTION 2026-06-27
音声生成 / TTS GitHub GPT-SoVITS
GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech(TTS)モデルをトレーニングできる強力なFew-s…
★ 59.1k ⑂ 6.4k MIT 2026-06-20
画像生成 GitHub LocalAI
LocalAIは、大規模言語モデル(LLMs)、視覚、音声、画像、ビデオなど、様々なAIモデルをどんなハードウェア環境でも…
★ 47.2k ⑂ 4.2k MIT 2026-06-28
LLM GitHub milvus
Milvusは、スケーラブルなベクトルANN検索のために構築された高性能なクラウドネイティブベクトルデータベースです。…
★ 44.9k ⑂ 4.1k Apache-2.0 2026-06-24
AIエージェント GitHub siyuan
SiYuanは、プライバシーを最重視した自己ホスト型の完全オープンソース個人知識管理ソフトウェアです。TypeScriptとG…
★ 44.6k ⑂ 2.8k AGPL-3.0 2026-06-26
LLM GitHub llmfit
llmfitは、ユーザーのRAM、CPU、GPUといったハードウェアリソースに合わせて最適な大規模言語モデル(LLM)を効率的…
★ 28.7k ⑂ 1.8k MIT 2026-06-24
音声生成 / TTS GitHub ebook2audiobook
「ebook2audiobook (E2A)」は、電子書籍(非DRM)を高品質なオーディオブックに変換するツールです。高度なTTSエンジ…
★ 19.3k ⑂ 1.6k Apache-2.0 2026-06-26
動画生成 GitHub waoowaoo
waoowaoo AI 影视 Studioは、AI技術を活用して短劇や漫画動画を制作するプラットフォームです。小説テキストから分鏡…
★ 13.0k ⑂ 2.9k NOASSERTION 2026-06-26
マルチモーダル GitHub all-in-rag
このプロジェクト「All-in-RAG」は、大規模言語モデル(LLM)アプリケーション開発者向けのRAG(検索拡張生成)技術…
★ 9.0k ⑂ 4.5k 2026-06-05
音声生成 / TTS GitHub EmotiVoice
EmotiVoiceは、Netease Youdaoが開発したオープンソースの多感情・プロンプト制御型テキスト読み上げ(TTS)エンジン…
★ 8.5k ⑂ 755 Apache-2.0 2024-08-13
ASR / 音声認識 GitHub OmniVoice-Studio
OmniVoice Studioは、オープンソースのElevenLabs代替ツールです。リアルタイムディクテーション、3秒の音声クリップ…
★ 7.7k ⑂ 1.2k NOASSERTION 2026-06-28
ComfyUI GitHub ComfyUI-3D-Pack
ComfyUI-3D-Packは、ComfyUI内で3Dアセット生成を効率的かつ便利に行うための広範なノードスイートです。このツール…
★ 3.8k ⑂ 365 MIT 2025-12-29
音声生成 / TTS GitHub TTS-WebUI
TTS WebUIは、GradioとReactを基盤とする統合型Webユーザーインターフェースで、様々なテキスト読み上げ(TTS)、音…
★ 3.2k ⑂ 326 MIT 2026-05-14
動画生成 GitHub AIComicBuilder
AI Comic Builderは、スクリプトからAIを駆使して全自動でアニメーションコミック動画を生成するツールです。AIによ…
★ 1.6k ⑂ 276 Apache-2.0 2026-04-27
AIエージェント GitHub phantom
Phantomは、使い捨てのチャットボットとは異なり、自身のコンピューターを持つ永続的なAIコワーカーです。セッション…
★ 1.4k ⑂ 190 Apache-2.0 2026-06-16
動画生成 GitHub ai-fusion-video
融光(AI-Fusion-Video)は、コンテンツクリエイター向けのAI短劇・漫劇・動画制作プラットフォームです。ユーザーが…
★ 941 ⑂ 187 MIT 2026-06-24
マルチモーダル HF YOLOv8
Ultralytics YOLOv8は、物体検出を中心に、追跡、インスタンスセグメンテーション、画像分類、姿勢推定、OBBまで幅広…
❤ 370 ↓ 9.3k agpl-3.0 2026-06-26
3D / NeRF GitHub MBA-SLAM
MBA-SLAMは、TPAMI 2025で発表された、モーションブラーを意識したDense Visual SLAMシステムです。動きによってぼや…
★ 77 ⑂ 2 Apache-2.0 2026-05-19
AIエージェント GitHub deputies
Deputiesは、エンジニアリング作業をバックグラウンドエージェントに委任するためのコントロールプレーンです。プロ…
★ 74 ⑂ 8 MIT 2026-06-18
ASR / 音声認識 GitHub AmicoScript
AmicoScriptは、OpenAIのWhisperモデルをベースにした、プライバシー重視のローカルオーディオ転写ツールです。ユー…
★ 61 ⑂ 2 MIT 2026-06-21
動画生成 GitHub open-director
OpenDirectorは、一行のアイデアから音声、BGM、絵コンテ付きの完成されたビデオを生成するオープンソースのAIビデオ…
★ 61 ⑂ 12 LGPL-3.0 2026-05-29
音楽生成 GitHub latentscore
LatentScoreは、テキスト記述からアンビエントミュージックを生成するPythonライブラリです。GPU不要でローカル環境…
★ 40 ⑂ 4 Apache-2.0 2026-05-29
ComfyUI GitHub comfyui-mcp
ComfyUI MCP Serverは、AIアシスタントがComfyUIを通じて画像、動画、音声、3Dコンテンツを生成することを可能にする…
★ 14 ⑂ 3 MIT 2026-01-28
音声生成 / TTS GitHub the-muser
The Muserは、SunoやElevenLabs Musicのオープンソース代替として、自然言語による音楽作曲を可能にするツールです。…
★ 6 ⑂ 1 MIT 2026-05-27