ComfyUI GitHub ComfyUI-RMBG
ComfyUI-RMBGは、ComfyUI向けの高度な画像背景除去およびオブジェクト、顔、服、ファッション要素の精密なセグメンテ…
★ 2.0k ⑂ 124 GPL-3.0 2026-02-03
動画生成 GitHub make-a-video-pytorch
Make-A-Video Pytorchは、Meta AIが発表した最先端のテキストから動画を生成するモデル「Make-A-Video」をPyTorchで…
★ 2.0k ⑂ 184 MIT 2024-05-03
AIエージェント GitHub agi
このシステムは、自律AIエージェントがP2Pネットワーク上で連携し、実験結果を共有することで、継続的に学習し進化す…
★ 1.9k ⑂ 235 MIT 2026-06-28
画像生成 GitHub Helios
Heliosは、リアルタイムでの長尺ビデオ生成を可能にする革新的なモデルです。従来のアンチドリフト戦略やアクセラレ…
★ 1.9k ⑂ 152 Apache-2.0 2026-06-10
マルチモーダル GitHub parlor
Parlorは、Gemma 4 E2BとKokoroを搭載し、デバイス上でリアルタイムに動作するマルチモーダルAIです。音声と視覚を理…
★ 1.9k ⑂ 227 Apache-2.0 2026-06-04
動画生成 GitHub HunyuanVideo-I2V
HunyuanVideo-I2Vは、HunyuanVideoを基盤としたカスタマイズ可能な画像から動画への生成モデルです。静止画像を入力…
★ 1.8k ⑂ 190 NOASSERTION 2026-04-07
LLM GitHub knowhere
Knowhereは、AIエージェントとRAG(検索拡張生成)のために非構造化データを準備する記憶層ツールです。PDFやOffice…
★ 1.8k ⑂ 211 Apache-2.0 2026-06-29
AIエージェント GitHub Cairn
Cairnは、起点と目標が与えられた未知の状態空間で経路を探索する汎用的な問題解決エンジンです。AIペネトレーション…
★ 1.8k ⑂ 256 AGPL-3.0 2026-06-02
AIエージェント GitHub build-your-own-openclaw
この「Build Your Own OpenClaw」は、AIエージェントを基礎から構築するためのステップバイステップガイドです。シン…
★ 1.7k ⑂ 309 MIT 2026-06-03
動画生成 GitHub TokenFlow
TokenFlowは、事前学習済みのテキストから画像への拡散モデルを利用し、追加のトレーニングやファインチューニングな…
★ 1.7k ⑂ 140 MIT 2025-02-03
動画生成 GitHub VBench
VBenchは、ビデオ生成モデルの包括的な評価とベンチマークを目的としたツール群の統一実装リポジトリです。幅広い能…
★ 1.7k ⑂ 127 Apache-2.0 2026-03-23
LLM GitHub MiniOneRec
MiniOneRecは、生成型推薦のための初の完全にオープンソースなフレームワークです。SID(Semantic Item Discretizati…
★ 1.7k ⑂ 237 Apache-2.0 2026-05-14
LLM GitHub mcp-brasil
mcp-brasilは、ブラジルの経済、立法、司法など70の公共データソースにAIエージェント(Claude, GPT, Copilot等)を…
★ 1.6k ⑂ 236 MIT 2026-04-26
LLM GitHub openlake
OpenLakeは、AIインフラ向けにGPUワークロードのデータ転送を高速化する、S3ワイヤー互換の分散オブジェクトストレー…
★ 1.6k ⑂ 253 Apache-2.0 2026-06-27
動画生成 GitHub stable-virtual-camera
Stable Virtual Camera (SEVA)は、拡散モデルを活用した汎用的な新規ビュー合成(NVS)ツールです。このツールは、与…
★ 1.6k ⑂ 121 NOASSERTION 2026-03-03
音声生成 / TTS GitHub Genie-TTS
GENIEは、オープンソースの音声合成プロジェクト「GPT-SoVITS」を基盤とした軽量推論エンジンです。TTS推論、ONNXモ…
★ 1.6k ⑂ 111 MIT 2026-04-18
動画生成 GitHub HunyuanWorld-Voyager
HunyuanWorld-Voyagerは、カメラ入力に基づくインタラクティブなRGBDビデオ生成モデルで、リアルタイム3D再構築をサ…
★ 1.6k ⑂ 164 NOASSERTION 2026-04-15
音声生成 / TTS GitHub soundstorm-pytorch
このツールは、Google Deepmindが開発した効率的な並列オーディオ生成モデル「SoundStorm」をPyTorchで実装したもの…
★ 1.5k ⑂ 94 MIT 2025-04-24
LLM GitHub tokenspeed
TokenSpeedは、agentic workloadsのために設計された「光速」LLM推論エンジンです。TensorRT-LLMと同等の高性能とvLL…
★ 1.5k ⑂ 174 MIT 2026-06-28
動画生成 GitHub MiniMax-MCP
MiniMax-AIの公式Model Context Protocol (MCP) サーバーであり、強力なテキスト読み上げ、画像生成、ビデオ生成のAP…
★ 1.5k ⑂ 272 MIT 2026-05-21
動画生成 GitHub text-to-video-synthesis-colab
このリポジトリは、テキストから動画を生成する複数のAIモデル(longscope、zeroscopeなど)をGoogle Colab上で手軽…
★ 1.5k ⑂ 185 Unlicense 2024-03-28
ComfyUI GitHub VibeVoice-ComfyUI
VibeVoice ComfyUI Nodesは、MicrosoftのVibeVoiceテキスト読み上げモデルをComfyUIに統合するツールです。これによ…
★ 1.5k ⑂ 242 MIT 2026-02-18
AIエージェント GitHub NanoResearch
エンドツーエンドの自律型AI科学研究エンジン「NanoResearch」は、研究アイデアから完全な論文作成までを自動化しま…
★ 1.5k ⑂ 102 MIT 2026-05-26
動画生成 GitHub Phantom
Phantomは、テキスト、画像、動画の複数モーダルな入力を元に、被写体の一貫性を高く保ちながら動画を生成する統合的…
★ 1.5k ⑂ 99 Apache-2.0 2025-09-11