3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#マルチモーダル (54 repos)

「マルチモーダル」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
GitHub
VisualClaw
VisualClawは、物理世界向けのリアルタイムでパーソナライズされたエージェントを構築するための自己進化型マルチモ…
★ 27 ⑂ 1 MIT 2026-06-16
動画生成
GitHub
Seedance-2.0-Gateway-Service
Seedance 2.0 Gateway Serviceは、テキストプロンプト、画像、マルチモーダルな参照入力からAI動画を生成するゲート…
★ 26 ⑂ 5 NOASSERTION 2026-06-16
動画生成
GitHub
awesome-gemini-omni-guide-api-and-prompt
このリポジトリは、Google Gemini OmniのAPI利用ガイドとプロンプト集です。Gemini Omniの高度な機能(動画生成、編…
★ 24 ⑂ 2 NOASSERTION 2026-06-15
マルチモーダル
GitHub
WikiSeeker
WikiSeekerは、知識ベースの視覚的質問応答(KB-VQA)のために開発された革新的なマルチモーダルRAGフレームワークで…
★ 15 Apache-2.0 2026-04-18
マルチモーダル
GitHub
goodq4all
GoodQ4Allは、ローカルファーストのマルチモーダル記憶システムで、長期間のビデオ、オーディオ、テキストからの情報…
★ 8 MIT 2026-06-21
マルチモーダル
GitHub
Multimodal-Edge-Node
Multimodal-Edge-Nodeは、実験的なノードベースの視覚的推論とマルチモーダル推論キャンバスです。ユーザーはカスタ…
★ 6 Apache-2.0 2026-05-01
マルチモーダル
GitHub
CodeBind
CodeBindは、大規模言語モデルやロボット工学におけるマルチモーダル表現アライメントの課題を解決するために開発さ…
★ 5 ⑂ 1 MIT 2026-05-19
マルチモーダル
GitHub
LiteRTLM-Swift-SDK
LiteRTLM Swift SDKは、GoogleのLiteRT-LM(オンデバイス推論エンジン)の非公式Swift SDKです。このツールはGemma 4…
★ 4 ⑂ 2 MIT 2026-05-02
ASR / 音声認識
GitHub
DialoStack
DialoStackは、ROS 2ロボットが目標指向の音声会話を行えるようにするフレームワークです。ユーザーから構造化データ…
★ 4 MIT 2026-06-04
マルチモーダル
GitHub
langchain-content-normalizer
langchain-content-normalizerは、LangChain、MCPツール、Anthropicコンテンツブロック、およびマルチモーダルチャッ…
★ 3 MIT 2026-06-03
マルチモーダル
GitHub
mimo-code
MiMo-Codeは、MiMoモデルファミリー専用のネイティブデスクトップコーディングエージェントです。WindowsおよびmacOS…
★ 3 MIT 2026-06-15
マルチモーダル
GitHub
kaggle-llm-server
このツールはKaggleのGPU上で動作するマルチモーダルLLMサーバーで、テキストと画像の処理が可能です。無料のKaggle …
★ 3 ⑂ 4 2026-05-24
マルチモーダル
GitHub
ai-annotation-rule-doc-skill
このツールは、AIモデル訓練データのアノテーションルール文書を効率的に作成するためのClaudeスキルです。テキスト…
★ 2 MIT 2026-06-08
動画生成
GitHub
seedance-2-api
Seedance 2 APIは、APIDotを通じて利用できる、ByteDance Seedが開発した高度なマルチモーダル動画生成モデルです。…
★ 1 MIT 2026-05-25
マルチモーダル
GitHub
loop-antigravity
loop-antigravityは、Google Antigravity (agy CLI) とGeminiの1Mトークンコンテキストおよびマルチモーダル推論能力…
★ 1 Apache-2.0 2026-06-14
マルチモーダル
GitHub
Tri-Sentinel-XAI
Tri-Sentinel XAIは、フィッシングURL、スパムテキスト、AI生成ディープフェイク画像を検出するマルチモーダルな説明…
★ 1 MIT 2026-06-13
LLM
GitHub
Drishti
Drishtiは、コードとドキュメントの理解を深めるためのマルチモーダルなRAG(検索拡張生成)システムです。Tree-sitt…
★ 1 MIT 2026-06-01
マルチモーダル
GitHub
xhs-note-reader
このツールは、中国のソーシャルメディア「小紅書」の図文ノート(画像とテキスト投稿)を、タイトル、本文、全画像…
★ 1 MIT 2026-05-19
マルチモーダル
GitHub
vlm-from-scratch-v4
Mini-LLaVA v4は、8GBのノートPC GPUで動作するように最適化された、CLIP-ViTとQwen2.5-1.5Bを組み合わせたマルチモ…
★ 1 MIT 2026-05-19
マルチモーダル
GitHub
ai-chef-multimodal-assistant
AI Chefは、自宅にある食材からレシピを生成するAI搭載のマルチモーダル料理アシスタントです。テキスト入力または食…
★ 1 2026-06-09
画像生成
GitHub
Lumina-AI
Lumina AIは、高度なマルチモーダルAIバーチャルコンパニオン兼アシスタントです。Gradioインターフェース上で動作し…
★ 1 MIT 2026-06-22
LLM
GitHub
visually-guided-subtitle-translation
このリポジトリは、EAMT 2026の論文「Towards Visually-Guided Movie Subtitle Translation for Indic Languages」で…
★ 1 Apache-2.0 2026-05-20