3,616 repos GH 3,501 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

マルチモーダル (298 repos)

カテゴリ「マルチモーダル」のリポジトリ一覧

← 全カテゴリ

マルチモーダル

siglip-so400m-patch14-384

SigLIP (shape-optimized model) は、WebLiデータセットで384x384の解像度で事前学習された多モーダルモデルです。従…

#Image-text retrieval

❤ 680 ↓ 1.7M apache-2.0 2024-09-26

マルチモーダル

GitHub

CCTV-Smartphone-AI-Monitoring

Sentinelは、LAN内で動作する分散型リアルタイムAI監視システムです。未使用のAndroidデバイスをネットワークカメラ…

#AI #Android #LANベース

★ 633 ⑂ 42 2026-06-26

マルチモーダル

Qwen2-Audio-7B-Instruct

Qwen2-Audio-7B-Instructは、音声入力を受けて会話や解析を行えるQwen系の音声対応大規模言語モデルです。テキストな…

#GPU推奨 #Python #バッチ推論対応

❤ 545 ↓ 570.5k apache-2.0 2025-01-12

マルチモーダル

Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF

このREADMEは、Qwen 3.6系をベースに40Bへ拡張し、Deckard系データセットやClaude 4.6 Opus由来データで多段階調整し…

#GGUF #Hugging Face #コーディング向け

❤ 538 ↓ 446.6k apache-2.0 2026-06-11

マルチモーダル

Qwen3.6-27B-Uncensored-HauhauCS-Aggressive

Qwen3.6-27Bをベースに、応答拒否を抑えたGGUF配布モデルです。Aggressive版は過激な指示でも前置きや言い訳を減らし…

#GGUF #GPU推奨 #llama.cpp対応

❤ 490 ↓ 456.5k apache-2.0 2026-04-24

マルチモーダル

GitHub

GLM-skills

「zai-org/GLM-skills」は、GLMモデルファミリー向けの公式スキルセットを統合したリポジトリです。Claude Code、Ope…

#AIエージェント #CLI #OCR

★ 442 ⑂ 36 Apache-2.0 2026-04-15

マルチモーダル

GitHub

clawapp

ClawAppは、強力なAIエージェントプラットフォームであるOpenClaw AIエージェント向けのモバイルチャットクライアン…

#AIエージェント #Node.js #PWA

★ 435 ⑂ 56 2026-05-07

マルチモーダル

table-transformer-detection

Table Transformer（Table Detection向け）は、PubTables-1Mで学習されたDETR系の表検出モデルで、請求書や論文PDFな…

#CLI #表検出

❤ 428 ↓ 1.5M mit 2023-09-06

マルチモーダル

GitHub

VEGA-3D

VEGA-3Dは、「Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding」の公式実装…

#CLI #GPU必須 #HuggingFace対応

★ 419 ⑂ 23 Apache-2.0 2026-06-18

マルチモーダル

BiomedCLIP-PubMedBERT_256-vit_base_patch16_224

BiomedCLIP-PubMedBERT_256-vit_base_patch16_224は、PubMed Central由来の1500万件の医用画像とキャプション対で事…

#CLI #GPU推奨 #Hugging Face

❤ 414 ↓ 616.7k mit 2025-01-14

マルチモーダル

sam3.1

SAM 3.1は、Metaの画像・動画向け統合基盤モデルで、プロンプト指定可能なセグメンテーションを提供します。テキスト…

#GPU必須 #セグメンテーション

❤ 404 ↓ 78.0k other 2026-03-27

マルチモーダル

GitHub

antfly

Antflyは、etcdのRaftライブラリを基盤とした分散型検索エンジンです。フルテキスト検索（BM25）、ベクトル類似性、…

#CLI #Go #Python

★ 403 ⑂ 26 NOASSERTION 2026-07-07

マルチモーダル

GitHub

Awesome-Multimodal-Modeling

このリポジトリは、マルチモーダルモデリングに関する包括的な調査と厳選されたリストです。伝統的なマルチモーダル…

#キュレーションリスト #マルチモーダルAI #研究

★ 393 ⑂ 23 2026-07-07

マルチモーダル

Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF

このREADMEは、Qwen 3.6 27Bをベースに検閲緩和と追加ファインチューニングを施し、さらにGGUF量子化版を多数用意し…

#GGUF #Vision対応 #ローカル推論

❤ 379 ↓ 220.2k apache-2.0 2026-06-11

マルチモーダル

GitHub

RISE

RISEは、自己改善型のロボットポリシーを構築するためのフレームワークです。ワールドモデルを実世界でのロボット操…

#AI/ML #CLI #Python

★ 308 ⑂ 19 2026-06-04

マルチモーダル

GitHub

awesome-agentic-world-modeling

「Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond」という論文に付随するリポジトリで、Agen…

★ 277 ⑂ 8 MIT 2026-06-27

マルチモーダル

GitHub

Thinking-with-Visual-Primitives

「Thinking with Visual Primitives」は、Multimodal Large Language Models (MLLM) が抱える「Reference Gap」を解…

#DeepSeek-V4-Flash #MLLM #Python

★ 266 ⑂ 64 MIT 2026-06-17

マルチモーダル

Qwen3.5-9B-DeepSeek-V4-Flash-GGUF

Qwen3.5-9Bをベースに、DeepSeek-V4由来の高品質な推論データで蒸留した軽量推論モデルのREADMEです。多段階の論理展…

#GGUF #エージェント向け #ローカル推論

❤ 258 ↓ 167.2k apache-2.0 2026-07-04

マルチモーダル

GitHub

genblaze

Genblazeは、生成AIによるビデオ、画像、オーディオのメディアパイプラインを構築・オーケストレーションするためのP…

#CLI #Python #S3互換

★ 256 ⑂ 9 MIT 2026-07-02

マルチモーダル

GitHub

WindsurfPoolAPI

このツールは、Windsurf AIプラットフォーム向けのエンタープライズ級マルチアカウントプールプロキシ「WindsurfPool…

#Anthropic API互換 #CLI #Node.js

★ 250 ⑂ 61 MIT 2026-04-26

マルチモーダル

GitHub

OpenSearch-VL

OpenSearch-VLは、最先端のマルチモーダル深層検索エージェントを訓練するためのオープンソースのレシピです。単一の…

#CLI #Python #マルチモーダル

★ 242 ⑂ 25 Apache-2.0 2026-05-19

マルチモーダル

GitHub

llm-intern-skill

「LLMInternSkill」は、大規模言語モデル（LLM）関連のインターンシップやAI分野での就職活動を目指す学生・求職者向…

#CLI #Codex Skill #Python

★ 234 ⑂ 11 MIT 2026-06-04

マルチモーダル

nemotron-ocr-v2

Nemotron OCR v2は、複雑な実写画像や文書画像から文字を高精度かつ高速に抽出する、NVIDIAの商用利用可能な多言語OC…

#GPU必須 #Linux #NVIDIA GPU対応

❤ 223 ↓ 13.2k other 2026-05-22

マルチモーダル

GitHub

knowledgeops-agent

「KnowledgeOps Agent」は、Spring AIを基盤としたエンタープライズ向けのマルチエージェントAIプラットフォームです…

#API #Docker #RAG

★ 215 ⑂ 16 MIT 2026-06-29