マルチモーダル GitHub parlor
Parlorは、Gemma 4 E2BとKokoroを搭載し、デバイス上でリアルタイムに動作するマルチモーダルAIです。音声と視覚を理…
★ 1.9k ⑂ 227 Apache-2.0 2026-06-04
AIエージェント GitHub build-your-own-openclaw
この「Build Your Own OpenClaw」は、AIエージェントを基礎から構築するためのステップバイステップガイドです。シン…
★ 1.7k ⑂ 309 MIT 2026-06-03
音声生成 / TTS HF chatterbox
Chatterboxは、Resemble AIが開発したオープンソースの高品質なテキスト読み上げ(TTS)モデルです。23言語に対応し…
❤ 1.7k ↓ 2.2M mit 2026-06-10
LLM GitHub AgentsMeetRL
AgentsMeetRLは、強化学習を活用してLLMエージェントを訓練するためのオープンソースリポジトリを厳選し、一覧化した…
★ 1.6k ⑂ 63 2026-06-20
動画生成 GitHub stable-virtual-camera
Stable Virtual Camera (SEVA)は、拡散モデルを活用した汎用的な新規ビュー合成(NVS)ツールです。このツールは、与…
★ 1.6k ⑂ 121 NOASSERTION 2026-03-03
動画生成 GitHub AIComicBuilder
AI Comic Builderは、スクリプトからAIを駆使して全自動でアニメーションコミック動画を生成するツールです。AIによ…
★ 1.6k ⑂ 276 Apache-2.0 2026-04-27
LLM GitHub awesome-architecture
このリポジトリは、コードを書くことよりも「アーキテクチャ」に焦点を当てたオープンソースの知識ベースです。AIが…
★ 1.5k ⑂ 163 MIT 2026-06-23
AIエージェント GitHub opencove
OpenCoveは、AIコーディングエージェント(Claude Code、Codexなど)を使用する開発者向けの空間型開発ワークスペー…
★ 1.5k ⑂ 121 MIT 2026-06-19
AIエージェント GitHub phantom
Phantomは、使い捨てのチャットボットとは異なり、自身のコンピューターを持つ永続的なAIコワーカーです。セッション…
★ 1.4k ⑂ 190 Apache-2.0 2026-06-16
AIエージェント GitHub OpenGenerativeUI
「Open Generative UI」は、CopilotKitとLangChain Deep Agentsを活用し、AIがリッチでインタラクティブなUIを生成す…
★ 1.4k ⑂ 189 MIT 2026-06-10
動画生成 GitHub Director
Directorは、ビデオコンテンツに対するAIエージェントフレームワークで、複雑なビデオタスク(検索、編集、コンパイ…
★ 1.4k ⑂ 231 MIT 2026-01-23
動画生成 GitHub DepthFlow
DepthFlowは、静止画像を魅力的な3Dパララックス効果のある動画に変換する高度なツールです。高品質なアニメーション…
★ 1.4k ⑂ 109 AGPL-3.0 2026-06-16
LLM HF Qwen3-0.6B
Qwen3は、推論、指示追従、エージェント機能、多言語サポートに優れた次世代の大規模言語モデルです。複雑な論理的推…
❤ 1.4k ↓ 27.7M apache-2.0 2025-07-26
音声生成 / TTS GitHub Chatterbox-TTS-Server
Chatterbox TTS Serverは、オープンソースのChatterbox TTSモデル(オリジナル、多言語、高速なTurbo版)をセルフホ…
★ 1.3k ⑂ 315 MIT 2026-05-26
LLM GitHub fim-one
FIM Oneは、グローバル企業が運用する世界中のSaaSサービスと中国独自のシステム(Feishu、WeComなど)を、単一のAI…
★ 1.3k ⑂ 146 NOASSERTION 2026-06-24
画像生成 GitHub FireRed-Image-Edit
FireRed-Image-Editは、高精度な指示追従、高忠実度な画像生成、優れたアイデンティティの一貫性、シームレスな多要…
★ 1.3k ⑂ 74 Apache-2.0 2026-04-03
音声生成 / TTS GitHub Twocast
Twocastは、AIを活用して2人対話形式のポッドキャストエピソードを生成するツールです。バイリンガルエピソードや多…
★ 1.3k ⑂ 125 2025-07-01
LLM GitHub future-agi
Future AGIは、LLMやAIエージェントアプリケーションの評価、監視、改善をエンドツーエンドで実現するオープンソース…
★ 1.2k ⑂ 289 Apache-2.0 2026-06-28
音声生成 / TTS GitHub tango
Tangoは、LLM(Flan-T5)によってガイドされる潜在拡散モデル(LDM)を用いた、テキストからオーディオを生成するツ…
★ 1.2k ⑂ 105 NOASSERTION 2025-07-29
LLM GitHub llmwiki
LLM Wikiは、KarpathyのLLM Wikiをオープンソースで実装した情報整理ツールです。ユーザーが持つ研究資料(PDF、ノー…
★ 1.2k ⑂ 198 Apache-2.0 2026-06-29
音声生成 / TTS GitHub BigVGAN
BigVGANは、NVIDIAが開発したユニバーサルなニューラルボコーダーであり、ICLR 2023で発表されました。大規模なデー…
★ 1.2k ⑂ 145 MIT 2024-09-05
動画生成 GitHub HunyuanCustom
HunyuanCustomは、画像、音声、ビデオ、テキストといった多様な入力モダリティを活用し、特定の被写体が登場するカス…
★ 1.2k ⑂ 110 NOASSERTION 2025-10-15
AIエージェント GitHub wuphf
WUPHF(ウーフ)は、AI従業員が協力して作業するための共有オフィス環境を提供します。AI従業員は自身の知識ベースを…
★ 1.2k ⑂ 87 NOASSERTION 2026-06-21
AIエージェント GitHub thClaws
thClawsは、Rustで実装されたオープンソースのAIエージェントハーネスプラットフォームです。ローカル環境で動作し、…
★ 1.1k ⑂ 157 Apache-2.0 2026-06-26