1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

マルチモーダル (159 repos)

カテゴリ「マルチモーダル」のリポジトリ一覧

← 全カテゴリ

マルチモーダル
GitHub
anything-llm
AnythingLLMは、ドキュメントとのチャットやAIエージェントの利用を可能にするオールインワンのAI生産性向上ツールで…
★ 59.9k ⑂ 6.5k MIT 2026-05-12
マルチモーダル
GitHub
UI-TARS-desktop
UI-TARS-desktopは、マルチモーダルAIエージェントスタックTARSの一部であり、UI-TARSモデルに基づくネイティブGUIエ…
★ 34.0k ⑂ 3.4k Apache-2.0 2026-05-15
マルチモーダル
GitHub
X-AnyLabeling
X-AnyLabelingは、Segment Anythingなどの強力なAIモデルを活用し、データラベリングを効率化するツールです。自動ラ…
★ 9.1k ⑂ 992 GPL-3.0 2026-05-13
マルチモーダル
GitHub
minimind-v
MiniMind-Vは、わずか3ドルと2時間で65MパラメータのビジョンマルチモーダルVLMをゼロから訓練できるプロジェクトで…
★ 8.0k ⑂ 866 Apache-2.0 2026-05-19
マルチモーダル
GitHub
vllm-omni
vLLM-Omniは、既存のvLLMを拡張し、オムニモダリティモデルの効率的かつ低コストな推論と提供を可能にするフレームワ…
★ 4.8k ⑂ 933 Apache-2.0 2026-05-16
マルチモーダル
HF
gemma-4-31B-it
Gemma 4 31B itは、Google DeepMindのオープンウェイトな命令調整済みマルチモーダルモデルです。テキストと画像を入…
❤ 2.6k ↓ 9.1M apache-2.0 2026-05-07
マルチモーダル
HF
GLM-OCR
GLM-OCRは、複雑な文書を高精度に読み取り・解析できるマルチモーダルOCRモデルです。数式、表、情報抽出まで対応し…
❤ 1.7k ↓ 7.9M mit 2026-04-14
マルチモーダル
HF
Gemma-4-31B-JANG_4M-CRACK
Gemma 4 31BベースのMLX向けマルチモーダル言語モデルで、画像入力を含む対話やコード生成、一般用途のアシスタント…
❤ 1.5k ↓ 124.0k gemma 2026-04-25
マルチモーダル
HF
Kimi-K2.6
Kimi K2.6は、Moonshot AIが公開するネイティブマルチモーダル対応のオープンソース大規模モデルです。長い手順を要…
❤ 1.3k ↓ 1.4M other 2026-05-11
マルチモーダル
HF
Qwen3.6-27B
Qwen3.6-27Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダルモデルです。画…
❤ 1.2k ↓ 2.4M apache-2.0 2026-04-24
マルチモーダル
HF
Qwen3.6-35B-A3B-GGUF
Qwen3.6-35B-A3B-GGUFは、Unslothが提供するQwen3.6系の量子化モデル配布で、コーディング支援やツール呼び出し、画…
❤ 996 ↓ 2.7M apache-2.0 2026-04-20
マルチモーダル
HF
gemma-4-26B-A4B-it
Gemma 4 26B A4B itは、Google DeepMindのオープンウェイトなマルチモーダル指示調整モデルです。テキストと画像を入…
❤ 928 ↓ 7.2M apache-2.0 2026-05-07
マルチモーダル
GitHub
ohmycaptcha
OhMyCaptchaは、FastAPI、Playwright、そしてOpenAI互換のマルチモーダルモデルで構築された、自己ホスト型のCAPTCHA…
★ 733 ⑂ 237 MIT 2026-03-09
マルチモーダル
HF
Qwen3.6-27B-GGUF
Qwen3.6-27B-GGUFは、Qwen3.6-27Bをもとにしたオープンウェイトの大規模言語・視覚対応モデルで、コード生成、リポジ…
❤ 654 ↓ 1.5M apache-2.0 2026-04-22
マルチモーダル
HF
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive
Qwen3.6-35B-A3Bをベースに、拒否応答を極力外したHauhauCS製のGGUF配布モデルです。テキストに加えて画像・動画も扱…
❤ 609 ↓ 1.1M apache-2.0 2026-04-17
マルチモーダル
GitHub
claude-video-vision
このツールは、AnthropicのAIであるClaudeに動画の視聴と理解能力を付与するClaude Codeプラグインです。ffmpegを用…
★ 593 ⑂ 72 MIT 2026-05-13
マルチモーダル
GitHub
CCTV-Smartphone-AI-Monitoring
Sentinelは、LAN内で動作する分散型リアルタイムAI監視システムです。未使用のAndroidデバイスをネットワークカメラ…
★ 584 ⑂ 42 2026-05-01
マルチモーダル
HF
Gemma-4-E4B-Uncensored-HauhauCS-Aggressive
Gemma 4 E4B-IT をベースに、応答拒否を大幅に外した GGUF 量子化モデルの配布ページです。Aggressive 版は安全制限…
❤ 559 ↓ 940.5k gemma 2026-04-06
マルチモーダル
GitHub
VEGA-3D
VEGA-3Dは、「Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding」の公式実装…
★ 437 ⑂ 22 Apache-2.0 2026-04-09
マルチモーダル
GitHub
clawapp
ClawAppは、強力なAIエージェントプラットフォームであるOpenClaw AIエージェント向けのモバイルチャットクライアン…
★ 417 ⑂ 49 2026-05-07
マルチモーダル
GitHub
GLM-skills
「zai-org/GLM-skills」は、GLMモデルファミリー向けの公式スキルセットを統合したリポジトリです。Claude Code、Ope…
★ 386 ⑂ 29 Apache-2.0 2026-04-15
マルチモーダル
GitHub
antfly
Antflyは、etcdのRaftライブラリを基盤とした分散型検索エンジンです。フルテキスト検索(BM25)、ベクトル類似性、…
★ 357 ⑂ 25 NOASSERTION 2026-05-14