3,601 repos GH 3,486 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

マルチモーダル (296 repos)

カテゴリ「マルチモーダル」のリポジトリ一覧

← 全カテゴリ

マルチモーダル

GitHub

knowledgeops-agent

「KnowledgeOps Agent」は、Spring AIを基盤としたエンタープライズ向けのマルチエージェントAIプラットフォームです…

#API #Docker #RAG

★ 214 ⑂ 16 MIT 2026-07-13

マルチモーダル

GitHub

autoresearch-qwen

autoresearch-qwenは、Qwen3-VL-4B-InstructモデルをDocumentVQAベンチマークで自律的に改善することを目的とした研…

#CLI #GPU必須 #Python

★ 211 ⑂ 33 MIT 2026-06-14

画像生成

GitHub

DISCO

DISCOは、タンパク質配列と3次元構造を同時に設計できる拡散ベースのマルチモーダル生成モデルです。小分子リガンド…

#CLI #CUDA対応 #GPU推奨

★ 207 ⑂ 23 Apache-2.0 2026-05-13

マルチモーダル

GitHub

Awesome-VLM-Streaming-Video

このリポジトリは、Vision-Language Models (VLM) をストリーミングビデオに応用する研究と開発のための、厳選された…

#GitHub #Python #VLM

★ 188 ⑂ 5 2026-06-10

マルチモーダル

GitHub

ScreenMind

ScreenMindは、PCの画面活動をAIでキャプチャ、分析し、検索可能なプライベートAIメモリを構築するツールです。Gemma…

#AI #GPU必須 #Python

★ 181 ⑂ 13 MIT 2026-07-09

マルチモーダル

GitHub

Multimodal-Recommendation-Library

MRLibは、マルチモーダル推薦システムの研究開発に特化したオープンソースライブラリです。画像、テキスト、音声など…

#CLI #GPU必須 #Python

★ 160 ⑂ 14 MIT 2026-05-08

マルチモーダル

GitHub

EI-Beginner

このリポジトリは、OpenMOSS研究室が提供する具身知能および人型ロボット知能の入門実践チュートリアルです。ロボッ…

#LLM/VLM対応 #Python #シミュレーション

★ 159 ⑂ 7 2026-05-27

マルチモーダル

GitHub

count-anything

Count Anythingは、テキストクエリに基づいて画像内のあらゆるオブジェクトを数えることができる汎用モデルです。自…

#CLI #GPU必須 #Hugging Face

★ 154 ⑂ 9 Apache-2.0 2026-07-08

マルチモーダル

GitHub

cerul

Cerulは、AIエージェント向けの動画検索レイヤーであり、音声だけでなく、スライド、グラフ、デモ、画面上のテキスト…

#AIエージェント連携 #API #CLI

★ 149 ⑂ 8 Apache-2.0 2026-07-13

マルチモーダル

GitHub

ICLR2026-Guide-CN

本ツールは、ICLR 2026の全5,352論文を大規模言語モデル（LLM）が分析し、その内容を「研究動機」「解決問題」「主要…

#CLI #GitHub #LLM活用

★ 147 ⑂ 7 2026-04-29

マルチモーダル

Falcon-OCR

Falcon OCRは、3億パラメータを持つ早期結合型ビジョン・言語モデルで、文書のOCR（光学文字認識）に特化しています…

#CLI #GPU推奨 #文書解析

❤ 121 ↓ 4.0k apache-2.0 2026-07-03

マルチモーダル

GitHub

guardian-sdk

Ethicore Engine™ — Guardian SDKは、Python製のLLMおよびエージェントアプリケーション向けの、リアルタイム脅威検…

#AIセキュリティ #LLM #Python

★ 118 ⑂ 13 NOASSERTION 2026-07-03

マルチモーダル

tipsv2-b14

TIPSv2 B/14は、画像とテキストを同じ埋め込み空間で扱えるGoogle系の視覚言語モデルです。画像全体の特徴量だけでな…

#CLI #GPU推論対応

❤ 114 ↓ 55.4k apache-2.0 2026-06-27

マルチモーダル

GitHub

Awesome-Embodied-AI-Safety

このリポジトリは、Embodied AI（身体を持つAI）の安全性に関する包括的な調査と、その分野で初の統一的な安全フレー…

#AI安全性 #Embodied AI #サーベイ論文

★ 113 ⑂ 3 NOASSERTION 2026-07-14

マルチモーダル

GitHub

WebDroid-Agent

WebDroid Agentは、ブラウザベースのAndroidスマートフォンエージェント実験プロジェクトです。WebUSB/WebADBを介し…

#Android ADB #OpenAI互換API #TypeScript

★ 106 ⑂ 20 MIT 2026-07-10

マルチモーダル

MOSS-VL-Instruct-0408

MOSS-VL-Instruct-0408は、OpenMOSS系の視覚言語モデルを教師あり微調整したマルチモーダル推論用チェックポイントで…

#CLI #GPU必須 #動画対応

❤ 97 ↓ 1.2k apache-2.0 2026-04-22

マルチモーダル

GitHub

cc-VisionRouter

cc-VisionRouterは、Claude Code環境で画像非対応のLLMを利用する際に、画像を含むリクエストを自動的にマルチモーダ…

#Anthropic Messages API互換 #CLI #Linux

★ 96 MIT 2026-06-07

マルチモーダル

GitHub

doubao2api

このプロジェクト「doubao2api」は、Doubao（豆包）クライアントAPIをリバースエンジニアリングしたもので、AIエージ…

#CLI #Docker #OpenAI互換

★ 94 ⑂ 28 Apache-2.0 2026-05-24

マルチモーダル

GitHub

locate-anything

「locate-anything」は、NVIDIAのLocateAnything-3Bモデルを利用した、モバイルフレンドリーなWebインターフェースで…

#Docker #GPU必須 #Web UI

★ 94 ⑂ 12 Apache-2.0 2026-07-02

マルチモーダル

GitHub

awesome-modality-missing-learning

このリポジトリは、モダリティ欠落学習（Modality Missing Learning, MML）および不完全マルチモーダル学習に関する…

#Machine Learning #Paper Collection #Research

★ 89 ⑂ 3 MIT 2026-06-27

マルチモーダル

GitHub

braviadev

このリポジトリは、修士号を持つコンピュータサイエンスの専門家であり、フルスタックエンジニア、そして博士課程の…

#AI/ML #Next.js #Node.js

★ 84 ⑂ 1 2026-07-14

マルチモーダル

GitHub

openmelon

OpenMelonは、ターミナル上で動作するAIコンテンツ作成エージェントです。ユーザーは単一のターミナルセッション内で…

#CLI #Go #LLM連携

★ 83 ⑂ 9 Apache-2.0 2026-05-11

マルチモーダル

GitHub

LabVLA

LabVLAは、Qwen3-VL-4B-Instructビジョン言語モデルを、DiTフローマッチングアクションエキスパートと独自のπ0.5レシ…

#CLI #GPU必須 #Python

★ 83 ⑂ 4 MIT 2026-07-04

マルチモーダル

GitHub

Awesome-AVI

JavisVerse/Awesome-AVIは、「大規模基盤モデルにおけるオーディオ・ビジュアル・インテリジェンス（AVI）」に関する…

★ 82 ⑂ 2 2026-05-08