3,720 repos GH 3,605 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

マルチモーダル (308 repos)

カテゴリ「マルチモーダル」のリポジトリ一覧

← 全カテゴリ

マルチモーダル
GitHub
multimodal-docs-public
M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…
★ 5 2026-06-09
マルチモーダル
GitHub
thesis-iot-monitoring
このツールは、自然言語の指示に基づいてIoTデバイスが自律的に視覚監視を行うシステムです。AIエージェントがユーザ…
★ 5 ⑂ 1 NOASSERTION 2026-06-05
マルチモーダル
GitHub
qw-register-helper
「qw-register-helper」は、Qwenアカウントのバッチ登録とアクティベーションを自動化するためのシンプルなツールで…
★ 4 ⑂ 2 MIT 2026-06-16
マルチモーダル
GitHub
AlignedNorm
AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…
★ 4 MIT 2026-06-12
マルチモーダル
GitHub
PaintBench
PaintBenchは、生成AIモデルの画像編集能力を決定論的に評価するためのベンチマークツールです。MSペイントのような…
★ 4 MIT 2026-06-02
マルチモーダル
GitHub
llm-router
LLM Routerは、OpenAI互換のAI Gatewayとして機能し、クライアントと既存のAI中継サービス間に配置されます。ユーザ…
★ 4 MIT 2026-06-17
マルチモーダル
GitHub
LiteRTLM-Swift-SDK
LiteRTLM Swift SDKは、GoogleのLiteRT-LM(オンデバイス推論エンジン)の非公式Swift SDKです。このツールはGemma 4…
★ 4 ⑂ 2 MIT 2026-05-02
マルチモーダル
GitHub
roboclaws
Roboclawsは、VLMポリシー、OpenClaw、AIコーディングエージェントによって駆動されるAIロボティクスデモのためのリ…
★ 4 ⑂ 1 MIT 2026-06-15
マルチモーダル
GitHub
inst2vec
molchalih/inst2vecは、Instagramのユーザーデータを詳細に分析し、美的クラスタリングと可視化を行うツールです。CS…
★ 4 Apache-2.0 2026-06-10
マルチモーダル
GitHub
vidground
VidGroundは、動画理解ベンチマークや機械学習の後学習データセットに内在する「動画を見なくても回答できる」テキス…
★ 4 MIT 2026-05-09
マルチモーダル
GitHub
OmniMemo
OmniMemoは、MiMo V2.5 全スタックモデルを基盤とした多モーダル会議インテリジェントエージェントです。最大の特長…
★ 3 MIT 2026-06-01
マルチモーダル
GitHub
robot-episode-curator
Robot Episode Curatorは、LeRobotデータセット内の外れ値エピソードを効率的に特定し、診断するためのツールです。R…
★ 3 Apache-2.0 2026-05-05
マルチモーダル
GitHub
loci-db
LOCIはAIワールドモデル向けの4次元時空間ベクトルデータベースです。埋め込みベクトルの位置と時間情報(x,y,z,t)…
★ 3 Apache-2.0 2026-06-11
マルチモーダル
GitHub
blink-skill
Blink Skillは、PC上でのユーザーのアクティビティ(会議、ドキュメント作業、動画視聴、コーディングなど)をAIが能…
★ 3 MIT 2026-05-02
マルチモーダル
GitHub
AI-Book-Discovery-App
Perspicuaは、図書館や書店での「選択のパラドックス」を解決するために設計された、高性能なAI駆動型セマンティック…
★ 3 GPL-3.0 2026-05-10
マルチモーダル
GitHub
langchain-content-normalizer
langchain-content-normalizerは、LangChain、MCPツール、Anthropicコンテンツブロック、およびマルチモーダルチャッ…
★ 3 MIT 2026-06-03
マルチモーダル
GitHub
tri-ai
Tri-AIは、Claude、Codex、Kimiなどの複数のAIモデルを連携させるためのポータブルなディスパッチプロトコルです。Cl…
★ 3 2026-04-14
マルチモーダル
GitHub
mio
Mioは、MiMoモデルファミリーに特化した、WindowsおよびmacOS向けの無料オープンソースのネイティブデスクトップコー…
★ 3 MIT 2026-06-13
マルチモーダル
GitHub
kaggle-llm-server
このツールはKaggleのGPU上で動作するマルチモーダルLLMサーバーで、テキストと画像の処理が可能です。無料のKaggle …
★ 3 ⑂ 4 2026-05-24
マルチモーダル
GitHub
SmolVLM2-Edge-Vision-Agent
SmolVLM2-2.2Bを搭載したエッジ展開可能なビジョンエージェントで、CPUのみのハードウェア(16GB RAM)で動作します…
★ 3 2026-04-27
マルチモーダル
GitHub
browserground
browsergroundは、ハイブリッドAIエージェント向けのローカルUIグラウンディングツールです。スクリーンショットとテ…
★ 3 2026-05-21
マルチモーダル
GitHub
tenderness
tendernessは、テキストと画像から合成かつ決定的なドキュメントを高速でレンダリングするためのPythonライブラリで…
★ 3 ⑂ 1 Apache-2.0 2026-06-14
マルチモーダル
GitHub
tamart
このリポジトリは、Multimodal LLM (MLLM) が芸術作品をどのように記述するかを解明する研究の公式コードです。Token…
★ 3 2026-05-25
マルチモーダル
GitHub
open_qwen
オープンQwenは、Qwen 3.5モデルを基にした、PyTorchを利用した非公式のAIテキスト生成アプリケーションです。プログ…
★ 3 Apache-2.0 2026-06-16