動画生成 GitHub Bernini
Berniniは、MLLMベースのセマンティックプランナーとDiTベースのレンダラーを組み合わせた、ビデオ生成および編集の…
★ 954 ⑂ 74 Apache-2.0 2026-06-22
LLM GitHub VibeSearchBench
VibeSearchBenchは、AI検索エージェントの性能を評価するための最難関ベンチマークツールです。曖昧で多段階の検索ク…
★ 952 ⑂ 62 MIT 2026-05-28
音楽生成 GitHub audio-ai-hub
このリポジトリは、オーディオAI研究のための包括的な情報ハブです。オーディオLLM、音声認識、音声合成、音楽・オー…
★ 934 ⑂ 48 2026-06-22
ComfyUI GitHub ComfyUI-MultiGPU
「ComfyUI-MultiGPU v2」は、人気のある画像生成UI「ComfyUI」用のカスタムノードです。UNetやCLIPローダー、WanVide…
★ 907 ⑂ 70 GPL-3.0 2026-05-08
LLM GitHub workshop
Raindrop Workshopは、エージェント(特にコーディングエージェント)のローカルデバッガーツールです。エージェント…
★ 902 ⑂ 56 MIT 2026-06-04
音楽生成 GitHub MidiTok
MidiTokは、MIDIやabcといった音楽ファイルをディープラーニングモデル(Transformerなど)が扱えるトークンシーケン…
★ 879 ⑂ 101 MIT 2026-06-22
AIエージェント GitHub harness-anything
このツール群「cli-anything-wps」は、AIエージェントが複数の主要なアプリケーションをCLI経由で制御するためのハー…
★ 872 ⑂ 49 MIT 2026-06-12
AIエージェント GitHub WorldSeed
WorldSeedは、AIエージェントが相互作用し、創発的な結果を生み出すマルチエージェントワールドエンジンです。ユーザ…
★ 858 ⑂ 54 MIT 2026-05-08
AIエージェント GitHub Photo-agents
Photo Agentsは、視覚情報に基づいてPCを操作する自律進化型エージェントです。画面上の情報を認識し、推論し、行動…
★ 845 ⑂ 23 MIT 2026-05-18
マルチモーダル GitHub claude-video-vision
このツールは、AnthropicのAIであるClaudeに動画の視聴と理解能力を付与するClaude Codeプラグインです。ffmpegを用…
★ 836 ⑂ 96 MIT 2026-05-18
3D / NeRF GitHub OpenWorldLib
OpenWorldLibは、高度なワールドモデル開発のための統合コードベースです。知覚、相互作用、長期記憶機能を核とし、…
★ 824 ⑂ 43 Apache-2.0 2026-06-11
AIエージェント GitHub swapper-toolkit
Swapper AI Agent Toolkitは、AIエージェントやコーディングアシスタント向けの決済レイヤーです。資金の入金、トー…
★ 817 ⑂ 33 MIT 2026-04-07
動画生成 GitHub Causal-Forcing
「Causal Forcing」およびその改良版「Causal Forcing++」は、因果ODEや因果Consistency Distillationを活用し、高品…
★ 803 ⑂ 46 Apache-2.0 2026-06-17
音声生成 / TTS GitHub Patter
Patterは、AIエージェントに電話番号を与え、電話通話機能を統合するためのオープンソースSDKです。PythonおよびType…
★ 784 ⑂ 82 MIT 2026-06-23
AIエージェント GitHub CORAL
CORALは、自律的なAIエージェント組織のための堅牢で軽量なインフラストラクチャです。実験実行、知識共有、ソリュー…
★ 764 ⑂ 99 Apache-2.0 2026-06-29
動画生成 GitHub Text-To-Video-AI
この「Text To Video AI」ツールは、AIを活用してテキストプロンプトから高品質な動画を自動生成します。YouTube Sho…
★ 759 ⑂ 294 MIT 2026-06-16
音楽生成 GitHub open-webui-tools
Open WebUI Toolsは、Open WebUIインスタンスを強力なAIワークステーションへと進化させるモジュラーツールキットで…
★ 754 ⑂ 69 MIT 2026-06-02
LLM GitHub OPD
このツールは、大規模言語モデル(LLM)のオンポリシー蒸留(OPD)のメカニズムとダイナミクスを系統的に調査する研…
★ 736 ⑂ 47 2026-06-29
AIエージェント GitHub OpenOSINT
OpenOSINTは、AIを搭載したOSINT(オープンソースインテリジェンス)エージェントです。対話型REPL(Read-Eval-Print…
★ 734 ⑂ 115 MIT 2026-06-21
音声生成 / TTS GitHub vui
Vuiは、WebRTCストリーミング、faster-whisper ASR、ローカルLLM、Vui Nano TTSを組み合わせたリアルタイム音声アシ…
★ 707 ⑂ 73 NOASSERTION 2026-06-12
LLM GitHub EurekaClaw
EurekaClawは、研究者の「ひらめき」を捉えるマルチエージェントAI研究アシスタントです。arXivなどの学術文献を自律…
★ 697 ⑂ 73 Apache-2.0 2026-06-13
LLM GitHub AwesomeOPD
AwesomeOPDは、LLM(大規模言語モデル)、VLM(視覚言語モデル)、エージェント、ドラフトモデルを対象としたオンポ…
★ 695 ⑂ 14 2026-06-23
画像生成 GitHub free-ai
FreeTheAiは、16,000以上の多様なAIモデルに対応した無料のOpenAI互換APIサービスです。チャット、ストリーミング、…
★ 685 ⑂ 106 2026-06-27
動画生成 GitHub AlayaRenderer
このリポジトリは、ゲームや仮想世界向けのAIネイティブなレンダラー「Generative World Renderer」を提供します。微…
★ 683 ⑂ 12 Apache-2.0 2026-05-05