1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

マルチモーダル (159 repos)

カテゴリ「マルチモーダル」のリポジトリ一覧

← 全カテゴリ

ComfyUI
GitHub
ComfyUI-Ollama-Describer
ComfyUI-Ollama-Describerは、ComfyUIの拡張機能で、Ollamaの多様なLLMモデル(Gemma、Llava、Llama2/3、Mistralなど…
★ 116 ⑂ 23 MIT 2026-03-19
マルチモーダル
GitHub
facio
Facioは、長期間のワークフローにおいて人間が介入できる、セキュアで追跡可能なプロアクティブAIエージェントです。…
★ 93 ⑂ 1 AGPL-3.0 2026-05-12
マルチモーダル
GitHub
ICLR2026-Guide-CN
本ツールは、ICLR 2026の全5,352論文を大規模言語モデル(LLM)が分析し、その内容を「研究動機」「解決問題」「主要…
★ 92 ⑂ 6 2026-04-29
マルチモーダル
GitHub
35gateway
「35Gateway」は、35m.aiが開発・運営するソース利用可能なAIゲートウェイです。テキスト、画像、動画、音声、音楽と…
★ 87 ⑂ 1 NOASSERTION 2026-04-15
マルチモーダル
GitHub
Awesome-Embodied-AI-Safety
このリポジトリは、Embodied AI(身体を持つAI)の安全性に関する包括的な調査と、その分野で初の統一的な安全フレー…
★ 83 NOASSERTION 2026-05-15
マルチモーダル
GitHub
openmelon
OpenMelonは、ターミナルで動作するコンテンツ作成エージェントランタイムです。再現性のあるマルチモーダルコンテン…
★ 79 ⑂ 8 Apache-2.0 2026-05-11
マルチモーダル
GitHub
guardian-sdk
Ethicore Engine™ — Guardian SDKは、Python製のLLMおよびエージェントアプリケーション向けの、リアルタイム脅威検…
★ 71 ⑂ 10 NOASSERTION 2026-05-22
マルチモーダル
GitHub
CourtSI
CourtSIは、スポーツ分野における空間知能を評価するための大規模データセットとベンチマークです。100万以上の質問…
★ 69 Apache-2.0 2026-03-15
マルチモーダル
GitHub
Multimodal-Recommendation-Library
MRLibは、マルチモーダル推薦システムの研究開発に特化したオープンソースライブラリです。画像、テキスト、音声など…
★ 69 ⑂ 6 MIT 2026-05-08
マルチモーダル
GitHub
shadow
ShadowはmacOS向けの高度なパーソナルAIエンジンです。画面、音声、キー入力、クリップボードなど、コンピューター上…
★ 60 ⑂ 3 MIT 2026-03-16
マルチモーダル
GitHub
WeiClaw
WeChat(微信)をあらゆるAIエージェントのインターフェースとして機能させるオープンソースツールです。`npx`コマン…
★ 58 ⑂ 6 MIT 2026-03-24
マルチモーダル
GitHub
GEditBench_v2
GEditBench v2は、汎用画像編集モデルの性能を人間が調整した基準で評価するための包括的なベンチマークです。1,200…
★ 53 ⑂ 1 2026-04-01
マルチモーダル
GitHub
Awesome-AVI
JavisVerse/Awesome-AVIは、「大規模基盤モデルにおけるオーディオ・ビジュアル・インテリジェンス(AVI)」に関する…
★ 51 2026-05-08
マルチモーダル
GitHub
GameVerse
GameVerseは、動画ベースの反射学習を通じてVision-Language Models (VLMs) がゲームプレイを学習できるかを検証する…
★ 49 MIT 2026-03-26
マルチモーダル
GitHub
awesome-modality-missing-learning
このリポジトリは、モダリティ欠落学習(Modality Missing Learning, MML)および不完全マルチモーダル学習に関する…
★ 44 ⑂ 2 MIT 2026-05-12
マルチモーダル
GitHub
neo-unify
このリポジトリは、SenseNovaの「Neo-Unify」に触発された、エンコーダフリーの統合マルチモーダルモデルの実験的な…
★ 42 ⑂ 1 2026-03-08
マルチモーダル
GitHub
HY-Embodied-0.5-X
HY-Embodied-0.5-Xは、Tencent Robotics XとHY Vision Teamが共同開発した、リアルワールドエージェント向けの拡張さ…
★ 41 ⑂ 3 NOASSERTION 2026-05-14
マルチモーダル
GitHub
ScreenClaw
ScreenClaw(睇虾)は、AIアプリケーションとデスクトップソフトウェアを連携させるためのローカル実行型ミドルウェ…
★ 39 ⑂ 11 MIT 2026-05-04
マルチモーダル
GitHub
Thinking-with-Visual-Primitives
「Thinking with Visual Primitives」は、Multimodal Large Language Models (MLLM) が抱える「Reference Gap」を解…
★ 38 ⑂ 38 MIT 2026-05-01
マルチモーダル
GitHub
rs-paper-hub
RS-Paper-Hubは、arXivからリモートセンシングおよび地球観測関連の論文を自動的に収集、整理、分類、タスクタグ付け…
★ 38 ⑂ 6 2026-05-15
マルチモーダル
GitHub
synthvision
SynthVisionは、医療画像VQA(Visual Question Answering)データセットの生成と、それを用いたVLM(Vision Language…
★ 32 ⑂ 5 2026-03-23
マルチモーダル
GitHub
SSM
このリポジリは、顔の動作単位(AU)と顔の表情(FE)の双方向学習を可能にするStructured Semantic Mapping(SSM)…
★ 27 2026-04-17
マルチモーダル
GitHub
Qwen-Lens-Studio
Qwen Lens Studioは、単一のQwenビジョン言語モデルを搭載したマルチモーダルAIスタジオです。視覚的推論、多言語画…
★ 25 ⑂ 6 2026-04-23
マルチモーダル
GitHub
MOSAIC
MOSAICは、強化学習(RL)、大規模言語モデル(LLM)、視覚言語モデル(VLM)、そして人間の意思決定者といった異な…
★ 24 ⑂ 4 MIT 2026-04-21