3,369 repos GH 3,254 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新
マルチモーダル (280 repos)
カテゴリ「マルチモーダル」のリポジトリ一覧
← 全カテゴリ
マルチモーダル GitHub Auto_Translator
Auto-Translatorは、複数のエージェントを活用したPDFコンテンツの自動翻訳ツールです。原文のフォーマットを完璧に…
★ 5 ⑂ 1 2026-04-16
マルチモーダル GitHub AlignedNorm
AlignedNormは、Vision-Language Models (VLMs) のプロンプト学習において、既存手法の局所最適化と汎化性能の限界を…
★ 4 MIT 2026-06-12
マルチモーダル GitHub llm-router
LLM Routerは、OpenAI互換のAI Gatewayとして機能し、クライアントと既存のAI中継サービス間に配置されます。ユーザ…
★ 4 MIT 2026-06-10
マルチモーダル GitHub LiteRTLM-Swift-SDK
LiteRTLM Swift SDKは、GoogleのLiteRT-LM(オンデバイス推論エンジン)の非公式Swift SDKです。このツールはGemma 4…
★ 4 ⑂ 2 MIT 2026-05-02
マルチモーダル GitHub roboclaws
Roboclawsは、VLMポリシー、OpenClaw、AIコーディングエージェントによって駆動されるAIロボティクスデモのためのリ…
★ 4 MIT 2026-06-02
マルチモーダル GitHub multimodal-docs-public
M-LongDocは、EMNLP 2025で採択されたマルチモーダル超長文ドキュメント理解のための挑戦的なベンチマークと、検索対…
★ 4 2026-06-09
マルチモーダル GitHub inst2vec
molchalih/inst2vecは、Instagramのユーザーデータを詳細に分析し、美的クラスタリングと可視化を行うツールです。CS…
★ 4 Apache-2.0 2026-06-05
マルチモーダル GitHub vidground
VidGroundは、動画理解ベンチマークや機械学習の後学習データセットに内在する「動画を見なくても回答できる」テキス…
★ 4 MIT 2026-05-09
マルチモーダル GitHub CodeBind
CodeBindは、大規模言語モデルやロボット工学におけるマルチモーダル表現アライメントの課題を解決するために開発さ…
★ 4 ⑂ 1 MIT 2026-05-19
マルチモーダル GitHub meeting-agent
このツールは、会議の録画(動画・音声)、文書(PDF、PPTX、DOCX、XLSX、CSV、TXT)、画像を取り込み、書き起こし、…
★ 3 MIT 2026-05-13
マルチモーダル GitHub AI-Book-Discovery-App
Perspicuaは、図書館や書店での「選択のパラドックス」を解決するために設計された、高性能なAI駆動型セマンティック…
★ 3 GPL-3.0 2026-05-10
マルチモーダル GitHub langchain-content-normalizer
langchain-content-normalizerは、LangChain、MCPツール、Anthropicコンテンツブロック、およびマルチモーダルチャッ…
★ 3 MIT 2026-06-03
マルチモーダル GitHub mio
Mioは、MiMoモデルファミリーに特化した、WindowsおよびmacOS向けの無料オープンソースのネイティブデスクトップコー…
★ 3 MIT 2026-06-13
マルチモーダル GitHub SmolVLM2-Edge-Vision-Agent
SmolVLM2-2.2Bを搭載したエッジ展開可能なビジョンエージェントで、CPUのみのハードウェア(16GB RAM)で動作します…
★ 3 2026-04-27
マルチモーダル GitHub kaggle-llm-server
このツールはKaggleのGPU上で動作するマルチモーダルLLMサーバーで、テキストと画像の処理が可能です。無料のKaggle …
★ 3 ⑂ 4 2026-05-24
マルチモーダル GitHub tenderness
tendernessは、テキストと画像から合成かつ決定的なドキュメントを高速でレンダリングするためのPythonライブラリで…
★ 3 Apache-2.0 2026-06-06
マルチモーダル GitHub goodq4all
GoodQ4Allは、ローカルファーストのマルチモーダル記憶システムで、長期間のビデオ、オーディオ、テキストからの情報…
★ 3 MIT 2026-05-31
マルチモーダル GitHub tamart
このリポジトリは、Multimodal LLM (MLLM) が芸術作品をどのように記述するかを解明する研究の公式コードです。Token…
★ 3 2026-05-25
マルチモーダル GitHub open_qwen
オープンQwenは、Qwen 3.5モデルを基にした、PyTorchを利用した非公式のAIテキスト生成アプリケーションです。プログ…
★ 3 Apache-2.0 2026-06-09
マルチモーダル GitHub reachy-mini-agent
reachy-mini-agentは、Reachy Miniロボット向けのリアルタイム音声・視覚AIエージェントです。このツールは、ローカ…
★ 3 Apache-2.0 2026-06-01
マルチモーダル GitHub LangSlice
LangSliceは、Vision-Language Model (VLM) を活用し、組織学的脳切片をBrainGlobeアトラスに自動で高精度に位置合わ…
★ 3 BSD-3-Clause 2026-06-03
マルチモーダル GitHub opencode-vision
opencode-visionは、マルチモーダルに対応していないOpenCodeモデルに画像認識機能を追加するツールです。ユーザーが…
★ 3 MIT 2026-06-01
マルチモーダル GitHub OmniMemo
OmniMemoは、MiMo V2.5 全スタックモデルを基盤とした多モーダル会議インテリジェントエージェントです。最大の特長…
★ 3 MIT 2026-06-01
マルチモーダル GitHub robot-episode-curator
Robot Episode Curatorは、LeRobotデータセット内の外れ値エピソードを効率的に特定し、診断するためのツールです。R…
★ 3 Apache-2.0 2026-05-05