1,782 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

マルチモーダル (158 repos)

カテゴリ「マルチモーダル」のリポジトリ一覧

← 全カテゴリ

マルチモーダル
HF
gemma-4-31B-it
Gemma 4 31B itは、Google DeepMindのオープンウェイトな命令調整済みマルチモーダルモデルです。テキストと画像を入…
❤ 2.7k ↓ 10.3M apache-2.0 2026-05-18
マルチモーダル
HF
sam3
SAM 3は、画像と動画に対してプロンプト可能なセグメンテーションを行う統合基盤モデルです。短いテキスト、点、ボッ…
❤ 2.0k ↓ 2.7M other 2025-11-20
マルチモーダル
HF
clip-vit-large-patch14
CLIPのViT-L/14版を提供する研究向け画像・テキスト理解モデルです。画像と自然言語の対応を同一空間で学習し、事前…
❤ 2.0k ↓ 31.5M 2023-09-15
マルチモーダル
HF
GLM-OCR
GLM-OCRは、複雑な文書を高精度に読み取り・解析できるマルチモーダルOCRモデルです。数式、表、情報抽出まで対応し…
❤ 1.8k ↓ 6.4M mit 2026-05-19
マルチモーダル
HF
Gemma-4-31B-JANG_4M-CRACK
Gemma 4 31BベースのMLX向けマルチモーダル言語モデルで、画像入力を含む対話やコード生成、一般用途のアシスタント…
❤ 1.5k ↓ 69.7k gemma 2026-04-25
マルチモーダル
HF
Qwen3.6-27B
Qwen3.6-27Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダルモデルです。画…
❤ 1.4k ↓ 4.1M apache-2.0 2026-04-24
マルチモーダル
HF
Kimi-K2.6
Kimi K2.6は、Moonshot AIが公開するネイティブマルチモーダル対応のオープンソース大規模モデルです。長い手順を要…
❤ 1.3k ↓ 2.7M other 2026-05-19
マルチモーダル
HF
Qwen3.6-35B-A3B-GGUF
Qwen3.6-35B-A3B-GGUFは、Unslothが提供するQwen3.6系の量子化モデル配布で、コーディング支援やツール呼び出し、画…
❤ 1.1k ↓ 2.4M apache-2.0 2026-04-20
マルチモーダル
HF
gemma-4-26B-A4B-it
Gemma 4 26B A4B itは、Google DeepMindのオープンウェイトなマルチモーダル指示調整モデルです。テキストと画像を入…
❤ 992 ↓ 9.9M apache-2.0 2026-05-18
マルチモーダル
HF
clip-vit-base-patch32
openai/clip-vit-base-patch32は、画像とテキストを同じ埋め込み空間で比較し、任意のラベル文との類似度からゼロシ…
❤ 939 ↓ 21.8M 2024-02-29
マルチモーダル
HF
vit-gpt2-image-captioning
`nlpconnect/vit-gpt2-image-captioning` は、画像を入力すると英語の説明文を自動生成できる画像キャプション生成モ…
❤ 930 ↓ 179.9k apache-2.0 2023-02-27
マルチモーダル
HF
blip-image-captioning-base
SalesforceのBLIP画像キャプション生成モデルのベース版で、COCOデータセットで学習された画像説明向けの事前学習モ…
❤ 855 ↓ 2.5M bsd-3-clause 2025-02-03
マルチモーダル
HF
Qwen3.6-27B-GGUF
Qwen3.6-27B-GGUFは、Qwen3.6-27Bをもとにしたオープンウェイトの大規模言語・視覚対応モデルで、コード生成、リポジ…
❤ 724 ↓ 2.0M apache-2.0 2026-04-22
マルチモーダル
HF
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive
Qwen3.6-35B-A3Bをベースに、拒否応答を極力外したHauhauCS製のGGUF配布モデルです。テキストに加えて画像・動画も扱…
❤ 706 ↓ 1.2M apache-2.0 2026-04-17
マルチモーダル
HF
siglip-so400m-patch14-384
SigLIP So400m Patch14 384は、Googleの画像と言語を結び付けるマルチモーダルモデルで、ゼロショット画像分類や画像…
❤ 674 ↓ 1.7M apache-2.0 2024-09-26
マルチモーダル
HF
Gemma-4-E4B-Uncensored-HauhauCS-Aggressive
Gemma 4 E4B-IT をベースに、応答拒否を大幅に外した GGUF 量子化モデルの配布ページです。Aggressive 版は安全制限…
❤ 644 ↓ 746.7k gemma 2026-04-06
マルチモーダル
HF
Qwen2-Audio-7B-Instruct
Qwen2-Audio-7B-Instructは、音声入力を受けて会話や解析を行えるQwen系の音声対応大規模言語モデルです。テキストな…
❤ 532 ↓ 579.8k apache-2.0 2025-01-12
マルチモーダル
HF
table-transformer-detection
Table Transformer(Table Detection向け)は、PubTables-1Mで学習されたDETR系の表検出モデルで、請求書や論文PDFな…
❤ 421 ↓ 2.3M mit 2023-09-06
マルチモーダル
HF
BiomedCLIP-PubMedBERT_256-vit_base_patch16_224
BiomedCLIP-PubMedBERT_256-vit_base_patch16_224は、PubMed Central由来の1500万件の医用画像とキャプション対で事…
❤ 406 ↓ 962.8k mit 2025-01-14
マルチモーダル
HF
Qwen3.6-27B-Uncensored-HauhauCS-Aggressive
Qwen3.6-27Bをベースに、応答拒否を抑えたGGUF配布モデルです。Aggressive版は過激な指示でも前置きや言い訳を減らし…
❤ 363 ↓ 590.3k apache-2.0 2026-04-24
マルチモーダル
HF
sam3.1
SAM 3.1は、Metaの画像・動画向けプロンプト可能セグメンテーション基盤モデルSAM 3の改良版チェックポイントです。…
❤ 285 ↓ 313.2k other 2026-03-27
マルチモーダル
HF
Qwen3.6-27B-Heretic-Uncensored-FINETUNE-NEO-CODE-Di-IMatrix-MAX-GGUF
このREADMEは、Qwen 3.6 27Bをベースに検閲緩和と追加ファインチューニングを施し、さらにGGUF量子化版を多数用意し…
❤ 220 ↓ 468.8k apache-2.0 2026-05-14
マルチモーダル
HF
nemotron-ocr-v2
Nemotron OCR v2は、複雑な実写画像や文書画像から文字を高精度かつ高速に抽出する、NVIDIAの商用利用可能な多言語OC…
❤ 188 ↓ 5.0k other 2026-05-22