音声生成 / TTS GitHub Kitten-TTS-Server
このKitten TTS Serverは、軽量なKitten TTSモデルをセルフホストするための高性能なAPIサーバーです。15MのNanoから…
★ 265 ⑂ 36 MIT 2026-03-28
AIエージェント GitHub NextBoard
NextBoardは、ハードウェア製品のPCB方案設計を支援するAIエージェントです。製品の要求を入力するだけで、要件確認…
★ 264 ⑂ 42 2026-05-05
マルチモーダル GitHub Thinking-with-Visual-Primitives
「Thinking with Visual Primitives」は、Multimodal Large Language Models (MLLM) が抱える「Reference Gap」を解…
★ 262 ⑂ 64 MIT 2026-06-17
LLM GitHub MineEcho
MineEchoは、個人のAIアシスタント向けに開発されたローカルファーストのメモリOSです。ユーザーの記憶、学習、スキ…
★ 261 ⑂ 26 NOASSERTION 2026-06-05
ASR / 音声認識 GitHub SoulX-Transcriber
SoulX-Transcriberは、複数の話者が登場する対話シナリオにおいて、話者特定(ダイアライゼーション)、タイムスタン…
★ 260 ⑂ 14 Apache-2.0 2026-06-22
動画生成 GitHub HyDRA
HyDRAは、動的なビデオ世界モデルにおいて、視界外に移動した被写体の追跡と動きの連続性維持を可能にするハイブリッ…
★ 258 ⑂ 14 2026-04-29
3D / NeRF GitHub video_to_world
本ツール「World Reconstruction From Inconsistent Views」は、ビデオ拡散モデルから3Dの世界を再構築する革新的な…
★ 258 ⑂ 23 MIT 2026-04-27
AIエージェント GitHub AutoResearch-SibylSystem
Sibyl Research Systemは、文献調査から仮説生成、GPU実験実行、そして学会発表レベルの論文執筆まで、機械学習研究…
★ 256 ⑂ 34 2026-03-25
動画生成 GitHub ARIS-in-AI-Offer
このツールは、中国語のML/LLM/マルチモーダル/生成モデル分野における就職活動(秋招)向けの面接チートシート集で…
★ 252 ⑂ 10 MIT 2026-06-29
LLM GitHub SecurityClaw
SecurityClawは、セキュリティ運用センター(SOC)向けに設計された、モジュラーでスキルベースの自律型エージェント…
★ 251 ⑂ 25 MIT 2026-06-18
ComfyUI GitHub Flux-Prompt-Generator
Flux-Prompt-Generatorは、ComfyUI向けの柔軟でカスタマイズ可能なプロンプト生成ノードです。Aitrepreneur氏のPytho…
★ 249 ⑂ 28 MIT 2025-11-22
ComfyUI GitHub ComfyUI-Mana-Nodes
ComfyUI-Mana-Nodesは、ComfyUI環境向けに開発されたカスタムノードの集合体です。フォントアニメーション、自動音声…
★ 247 ⑂ 19 MIT 2024-05-29
LLM GitHub PosterGen
PosterGenは、マルチエージェントLLMフレームワークを活用し、学術論文から美的感覚に優れたポスターを自動生成する…
★ 241 ⑂ 22 MIT 2026-06-01
画像生成 GitHub MultiWorld
MultiWorldは、マルチエージェント・マルチビュービデオ世界モデルのための統合フレームワークです。複数のエージェ…
★ 237 ⑂ 12 NOASSERTION 2026-05-12
画像生成 GitHub chatgpt-imagegen
chatgpt-imagegenは、ChatGPTのサブスクリプションを利用してコマンドラインやAIエージェントから画像を生成できる、…
★ 237 ⑂ 23 MIT 2026-06-25
ComfyUI GitHub ComfyUI-Pixaroma
ComfyUI Pixaromaは、Stable DiffusionのWeb UIであるComfyUIのワークフローを、プロフェッショナルグレードのクリエ…
★ 237 ⑂ 17 MIT 2026-06-26
マルチモーダル GitHub OpenSearch-VL
OpenSearch-VLは、最先端のマルチモーダル深層検索エージェントを訓練するためのオープンソースのレシピです。単一の…
★ 236 ⑂ 25 Apache-2.0 2026-05-19
LLM GitHub statewave
Statewaveは、AIエージェントに再現可能で出所が明記されたコンテキストを提供するオープンソースのメモリランタイム…
★ 231 ⑂ 11 Apache-2.0 2026-06-25
LLM GitHub steerling
Steerlingは、解釈可能な因果拡散言語モデルであり、マスク型拡散言語モデリングとコンセプト分解を統合しています。…
★ 229 ⑂ 14 Apache-2.0 2026-06-24
動画生成 GitHub OpenS2V-Nexus
OpenS2V-Nexusは、PKU-YuanGroupによるSubject-to-Video生成のための公式実装で、NeurIPS 2025 D&Bで発表されます。…
★ 223 ⑂ 9 Apache-2.0 2026-05-19
AIエージェント GitHub agent-platform
GoogleのGemini Enterprise Agent Platform(旧Vertex AI)上でAIエージェントを構築するためのコードサンプルとチュ…
★ 222 ⑂ 40 Apache-2.0 2026-05-27
3D / NeRF GitHub TokenGS
TokenGSは、自己教師ありレンダリング目的で3Dガウスを予測する革新的なツールです。学習可能なガウストークンをエン…
★ 221 ⑂ 7 Apache-2.0 2026-06-15
ComfyUI GitHub ControlNet-LLLite-ComfyUI
ControlNet-LLLite-ComfyUIは、実験的な画像生成モデル「ControlNet-LLLite」の推論用UIです。ComfyUIのカスタムノー…
★ 221 ⑂ 16 GPL-3.0 2024-05-22
動画生成 GitHub VEFX-Bench
VEFX-Benchは、テキスト駆動型ビデオ編集および視覚効果の総合的な評価ベンチマークです。5,049件のアノテーション付…
★ 214 ⑂ 16 Apache-2.0 2026-05-16