3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
#マルチモーダルAI (17 repos)
「マルチモーダルAI」タグが付いたリポジトリ
← 全リポジトリ
マルチモーダル GitHub vllm-omni
vLLM-Omniは、既存のvLLMを拡張し、オムニモダリティモデルの効率的かつ低コストな推論と提供を可能にするフレームワ…
★ 5.3k ⑂ 1.2k Apache-2.0 2026-06-29
マルチモーダル GitHub parlor
Parlorは、Gemma 4 E2BとKokoroを搭載し、デバイス上でリアルタイムに動作するマルチモーダルAIです。音声と視覚を理…
★ 1.9k ⑂ 227 Apache-2.0 2026-06-04
マルチモーダル GitHub GLM-skills
「zai-org/GLM-skills」は、GLMモデルファミリー向けの公式スキルセットを統合したリポジトリです。Claude Code、Ope…
★ 436 ⑂ 36 Apache-2.0 2026-04-15
マルチモーダル GitHub Awesome-Multimodal-Modeling
このリポジトリは、マルチモーダルモデリングに関する包括的な調査と厳選されたリストです。伝統的なマルチモーダル…
★ 388 ⑂ 23 2026-06-23
画像生成 GitHub Mobile-O
Mobile-Oは、モバイルデバイス上で動作する、統一されたマルチモーダルAIモデルです。画像理解(VQA、OCR、推論)と…
★ 150 ⑂ 15 NOASSERTION 2026-04-13
マルチモーダル GitHub Qwen-Lens-Studio
Qwen Lens Studioは、単一のQwenビジョン言語モデルを中心に構築されたマルチモーダルAIスタジオです。UIスクリーン…
★ 27 ⑂ 6 2026-04-23
マルチモーダル GitHub awesome-gemini-omni
このリポジトリは、Googleの次世代マルチモーダルAIモデル「Gemini Omni」に関する厳選されたリソース集です。テキス…
★ 24 ⑂ 1 CC0-1.0 2026-05-31
3D / NeRF GitHub BrainDance
BrainDanceは、3D Gaussian Splatting(高斯泼溅)技術を利用して、現実空間をインタラクティブで回顧可能なホログラ…
★ 15 ⑂ 1 NOASSERTION 2026-06-02
ASR / 音声認識 GitHub multi-modal-agent-ts
このツールは、TypeScriptで書かれたマルチモーダルAIエージェントで、画像、音声、テキストを組み合わせて処理でき…
★ 12 ⑂ 1 2026-04-17
マルチモーダル GitHub Lumen
Lumenは、チャット、ビジョンQA、テキストから画像生成、画像から画像生成、長文会話圧縮、画像共有、Telegramボット…
★ 12 NOASSERTION 2026-06-28
マルチモーダル GitHub 35gateway
「35Gateway」は、35m.aiが開発・運営するソース利用可能なAIゲートウェイです。テキスト、画像、動画、音声、音楽と…
★ 6 ⑂ 1 NOASSERTION 2026-04-15
動画生成 GitHub awesome-seedance-2-prompts
このリポジトリは、Seedance 2.0のプロンプト、マルチモーダルAIビデオワークフロー、画像からビデオへの変換例、音…
★ 3 2026-04-28
マルチモーダル GitHub sentra-rag-failure-modes
このリポジトリは、Googleの最新マルチモーダル埋め込みモデル`gemini-embedding-2`の経験的失敗モードと幾何学的特…
★ 2 MIT 2026-05-08
マルチモーダル GitHub rag-multimodal
このプロジェクトは、複雑な表や図を含むPDF文書から情報を抽出するマルチモーダルRAGシステムの実装デモです。マル…
★ 2 MIT 2026-06-21
マルチモーダル GitHub airline-support-agent
このツールは、架空の航空会社FlightAIのためのマルチモーダルAIカスタマーサポートチャットボット「Airline Support…
★ 1 ⑂ 1 2026-06-12