マルチモーダル GitHub anything-llm
AnythingLLMは、ドキュメントとのチャットやAIエージェントの利用を可能にするオールインワンのAI生産性向上ツールで…
★ 59.9k ⑂ 6.5k MIT 2026-05-12
マルチモーダル GitHub UI-TARS-desktop
UI-TARS-desktopは、マルチモーダルAIエージェントスタックTARSの一部であり、UI-TARSモデルに基づくネイティブGUIエ…
★ 34.0k ⑂ 3.4k Apache-2.0 2026-05-15
マルチモーダル GitHub X-AnyLabeling
X-AnyLabelingは、Segment Anythingなどの強力なAIモデルを活用し、データラベリングを効率化するツールです。自動ラ…
★ 9.1k ⑂ 992 GPL-3.0 2026-05-13
マルチモーダル GitHub minimind-v
MiniMind-Vは、わずか3ドルと2時間で65MパラメータのビジョンマルチモーダルVLMをゼロから訓練できるプロジェクトで…
★ 8.0k ⑂ 866 Apache-2.0 2026-05-19
マルチモーダル GitHub vllm-omni
vLLM-Omniは、既存のvLLMを拡張し、オムニモダリティモデルの効率的かつ低コストな推論と提供を可能にするフレームワ…
★ 4.8k ⑂ 933 Apache-2.0 2026-05-16
マルチモーダル GitHub parlor
Parlorは、Gemma 4 E2BとKokoroを搭載し、デバイス上でリアルタイムに動作するマルチモーダルAIです。音声と視覚を理…
★ 1.8k ⑂ 213 Apache-2.0 2026-05-11
マルチモーダル GitHub ohmycaptcha
OhMyCaptchaは、FastAPI、Playwright、そしてOpenAI互換のマルチモーダルモデルで構築された、自己ホスト型のCAPTCHA…
★ 733 ⑂ 237 MIT 2026-03-09
マルチモーダル GitHub claude-video-vision
このツールは、AnthropicのAIであるClaudeに動画の視聴と理解能力を付与するClaude Codeプラグインです。ffmpegを用…
★ 593 ⑂ 72 MIT 2026-05-13
マルチモーダル GitHub CCTV-Smartphone-AI-Monitoring
Sentinelは、LAN内で動作する分散型リアルタイムAI監視システムです。未使用のAndroidデバイスをネットワークカメラ…
★ 584 ⑂ 42 2026-05-01
マルチモーダル GitHub VEGA-3D
VEGA-3Dは、「Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding」の公式実装…
★ 437 ⑂ 22 Apache-2.0 2026-04-09
マルチモーダル GitHub clawapp
ClawAppは、強力なAIエージェントプラットフォームであるOpenClaw AIエージェント向けのモバイルチャットクライアン…
★ 417 ⑂ 49 2026-05-07
マルチモーダル
GitHub GLM-skills
「zai-org/GLM-skills」は、GLMモデルファミリー向けの公式スキルセットを統合したリポジトリです。Claude Code、Ope…
★ 386 ⑂ 29 Apache-2.0 2026-04-15
マルチモーダル GitHub antfly
Antflyは、etcdのRaftライブラリを基盤とした分散型検索エンジンです。フルテキスト検索(BM25)、ベクトル類似性、…
★ 357 ⑂ 25 NOASSERTION 2026-05-14
マルチモーダル GitHub Awesome-Multimodal-Modeling
このリポジトリは、マルチモーダルモデリングに関する包括的な調査と厳選されたリストです。伝統的なマルチモーダル…
★ 327 ⑂ 17 2026-05-09
マルチモーダル GitHub awesome-agentic-world-modeling
「Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond」という論文に付随するリポジトリで、Agen…
★ 209 ⑂ 5 MIT 2026-05-11
マルチモーダル
GitHub autoresearch-qwen
autoresearch-qwenは、Qwen3-VL-4B-InstructモデルをDocumentVQAベンチマークで自律的に改善することを目的とした研…
★ 209 ⑂ 33 MIT 2026-05-12
マルチモーダル GitHub WindsurfPoolAPI
このツールは、Windsurf AIプラットフォーム向けのエンタープライズ級マルチアカウントプールプロキシ「WindsurfPool…
★ 209 ⑂ 51 MIT 2026-04-26
マルチモーダル GitHub knowledgeops-agent
「KnowledgeOps Agent」は、Spring AIを基盤としたエンタープライズ向けのマルチエージェントAIプラットフォームです…
★ 208 ⑂ 11 MIT 2026-05-12
マルチモーダル GitHub OpenSearch-VL
OpenSearch-VLは、最先端のマルチモーダル深層検索エージェントを訓練するためのオープンソースのレシピです。単一の…
★ 175 ⑂ 14 Apache-2.0 2026-05-13
画像生成 GitHub DISCO
DISCOは、タンパク質配列と3次元構造を同時に設計できる拡散ベースのマルチモーダル生成モデルです。小分子リガンド…
★ 174 ⑂ 20 Apache-2.0 2026-04-09
マルチモーダル GitHub Graph-CAD
Graph-CADは、自然言語の指示から実行可能なBlender用CADコードを自動生成するための、グラフ媒介型Text-to-CADフレ…
★ 167 ⑂ 12 2026-03-30
マルチモーダル
GitHub Awesome-VLM-Streaming-Video
このリポジトリは、Vision-Language Models (VLM) をストリーミングビデオに応用する研究と開発のための、厳選された…
★ 156 ⑂ 4 2026-05-12
マルチモーダル GitHub cerul
Cerulは、AIエージェント向けの動画検索レイヤーであり、音声だけでなく、スライド、グラフ、デモ、画面上のテキスト…
★ 136 ⑂ 6 Apache-2.0 2026-05-18
マルチモーダル GitHub GEMS
GEMSは、エージェントネイティブなマルチモーダル生成のための先進的なフレームワークです。記憶とスキルを活用し、K…
★ 127 ⑂ 10 2026-04-01