音楽生成 GitHub FunMusic
InspireMusicは、音楽、歌、オーディオ生成に特化した統合ツールキットです。このツールは、高いオーディオ品質で長…
★ 1.4k ⑂ 139 Apache-2.0 2025-05-20
マルチモーダル GitHub mlx-tune
mlx-tuneは、Apple Silicon搭載Mac上でLLM、Vision、Audio、OCRモデルのファインチューニングをネイティブに実行する…
★ 1.3k ⑂ 85 Apache-2.0 2026-06-23
LLM GitHub llm-architecture-gallery
このツールは、GitHub上のAI関連オープンソースプロジェクトを自動的に発見し、LLM(大規模言語モデル)による要約と…
★ 1.3k ⑂ 115 Apache-2.0 2026-06-21
音声生成 / TTS GitHub Chatterbox-TTS-Server
Chatterbox TTS Serverは、オープンソースのChatterbox TTSモデル(オリジナル、多言語、高速なTurbo版)をセルフホ…
★ 1.3k ⑂ 315 MIT 2026-05-26
LLM GitHub fim-one
FIM Oneは、グローバル企業が運用する世界中のSaaSサービスと中国独自のシステム(Feishu、WeComなど)を、単一のAI…
★ 1.3k ⑂ 146 NOASSERTION 2026-06-24
画像生成 GitHub FireRed-Image-Edit
FireRed-Image-Editは、高精度な指示追従、高忠実度な画像生成、優れたアイデンティティの一貫性、シームレスな多要…
★ 1.3k ⑂ 74 Apache-2.0 2026-04-03
AIエージェント GitHub CoreCoder
CoreCoderは、約1,400行のPythonコードで実装された最小限のAIコーディングエージェントです。Claude Codeの主要なア…
★ 1.3k ⑂ 295 MIT 2026-06-23
AIエージェント GitHub evo
evoは、コードベースの自動研究オーケストレーターです。既存のコードを解析し、最適化目標を特定してベンチマークを…
★ 1.3k ⑂ 95 Apache-2.0 2026-06-29
LLM GitHub future-agi
Future AGIは、LLMやAIエージェントアプリケーションの評価、監視、改善をエンドツーエンドで実現するオープンソース…
★ 1.2k ⑂ 289 Apache-2.0 2026-06-28
音声生成 / TTS GitHub tango
Tangoは、LLM(Flan-T5)によってガイドされる潜在拡散モデル(LDM)を用いた、テキストからオーディオを生成するツ…
★ 1.2k ⑂ 105 NOASSERTION 2025-07-29
LLM GitHub llmwiki
LLM Wikiは、KarpathyのLLM Wikiをオープンソースで実装した情報整理ツールです。ユーザーが持つ研究資料(PDF、ノー…
★ 1.2k ⑂ 198 Apache-2.0 2026-06-29
画像生成 GitHub Lance
LanceはByteDanceが開発した30億パラメータのマルチモーダルAIモデルです。単一フレームワーク内で画像および動画の…
★ 1.2k ⑂ 87 Apache-2.0 2026-06-17
音声生成 / TTS GitHub BigVGAN
BigVGANは、NVIDIAが開発したユニバーサルなニューラルボコーダーであり、ICLR 2023で発表されました。大規模なデー…
★ 1.2k ⑂ 145 MIT 2024-09-05
動画生成 GitHub HunyuanCustom
HunyuanCustomは、画像、音声、ビデオ、テキストといった多様な入力モダリティを活用し、特定の被写体が登場するカス…
★ 1.2k ⑂ 110 NOASSERTION 2025-10-15
AIエージェント GitHub auto-deep-researcher-24×7
「Deep Researcher Agent」は、深層学習の実験を24時間365日自律的に実行するAIエージェントです。ゼロコスト監視、…
★ 1.2k ⑂ 100 Apache-2.0 2026-06-03
AIエージェント GitHub cq
cqは、AIエージェントが同じ過ちを繰り返すことを防ぐためのオープンな知識共有標準です。エージェントは学習した知…
★ 1.2k ⑂ 62 Apache-2.0 2026-06-29
ComfyUI GitHub comfyui-inpaint-nodes
ComfyUI向けに高品質なインペイント機能を提供するノード集です。Fooocusインペイントモデル(SDXL対応)、LaMa、MAT…
★ 1.2k ⑂ 74 GPL-3.0 2026-05-31
マルチモーダル HF gemma-4-26B-A4B-it
Gemma 4 26B A4B itは、Google DeepMindのオープンウェイトなマルチモーダル指示調整モデルです。テキストと画像を入…
❤ 1.2k ↓ 13.1M apache-2.0 2026-06-03
LLM GitHub memory-os
Memory OSは、Hermes Agentに永続的な長期記憶機能を提供する7層構造のメモリオペレーティングシステムです。エージ…
★ 1.2k ⑂ 113 MIT 2026-06-10
ComfyUI GitHub RES4LYF
RES4LYFは、ComfyUI向けの先進的な画像生成サンプラーとユーティリティのコレクションです。独自のノイズスケーリン…
★ 1.2k ⑂ 113 NOASSERTION 2026-06-15
画像生成 HF stable-diffusion-v1-5
Stable Diffusion v1-5は、テキスト入力に基づいて写実的な画像を生成できる強力な潜在テキスト-画像拡散モデルです…
❤ 1.2k ↓ 1.8M creativeml-openrail-m 2024-09-07
AIエージェント GitHub mnemosyne
Mnemosyneは、AIエージェント向けのゼロ依存性、SQLiteベースの超高速(サブミリ秒)記憶システムです。Claude Code…
★ 1.2k ⑂ 108 MIT 2026-06-17
LLM GitHub memanto
MemantoはAIエージェント向けの能動的な記憶エージェントです。AIエージェントが長期的な目標を達成し、混乱を避ける…
★ 1.1k ⑂ 337 MIT 2026-06-23
音声生成 / TTS HF OmniVoice
OmniVoiceは、600以上の言語に対応する多言語ゼロショットテキスト音声合成(TTS)モデルです。独自の拡散言語モデル…
❤ 1.1k ↓ 1.0M apache-2.0 2026-05-07