マルチモーダル HF siglip-so400m-patch14-384
SigLIP So400m Patch14 384は、Googleの画像と言語を結び付けるマルチモーダルモデルで、ゼロショット画像分類や画像…
❤ 674 ↓ 2.1M apache-2.0 2024-09-26
マルチモーダル HF Qwen3.6-27B-GGUF
Qwen3.6-27B-GGUFは、Qwen3.6-27Bをもとにしたオープンウェイトの大規模言語・視覚対応モデルで、コード生成、リポジ…
❤ 654 ↓ 1.5M apache-2.0 2026-04-22
マルチモーダル
HF Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive
Qwen3.6-35B-A3Bをベースに、拒否応答を極力外したHauhauCS製のGGUF配布モデルです。テキストに加えて画像・動画も扱…
❤ 609 ↓ 1.1M apache-2.0 2026-04-17
マルチモーダル GitHub claude-video-vision
このツールは、AnthropicのAIであるClaudeに動画の視聴と理解能力を付与するClaude Codeプラグインです。ffmpegを用…
★ 593 ⑂ 72 MIT 2026-05-13
マルチモーダル GitHub CCTV-Smartphone-AI-Monitoring
Sentinelは、LAN内で動作する分散型リアルタイムAI監視システムです。未使用のAndroidデバイスをネットワークカメラ…
★ 584 ⑂ 42 2026-05-01
マルチモーダル
HF Gemma-4-E4B-Uncensored-HauhauCS-Aggressive
Gemma 4 E4B-IT をベースに、応答拒否を大幅に外した GGUF 量子化モデルの配布ページです。Aggressive 版は安全制限…
❤ 559 ↓ 940.5k gemma 2026-04-06
マルチモーダル
HF Qwen2-Audio-7B-Instruct
Qwen2-Audio-7B-Instructは、音声入力を受けて会話や解析を行えるQwen系の音声対応大規模言語モデルです。テキストな…
❤ 530 ↓ 428.1k apache-2.0 2025-01-12
マルチモーダル GitHub VEGA-3D
VEGA-3Dは、「Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding」の公式実装…
★ 437 ⑂ 22 Apache-2.0 2026-04-09
マルチモーダル
HF table-transformer-detection
Table Transformer(Table Detection向け)は、PubTables-1Mで学習されたDETR系の表検出モデルで、請求書や論文PDFな…
❤ 421 ↓ 3.2M mit 2023-09-06
マルチモーダル GitHub clawapp
ClawAppは、強力なAIエージェントプラットフォームであるOpenClaw AIエージェント向けのモバイルチャットクライアン…
★ 417 ⑂ 49 2026-05-07
マルチモーダル
HF BiomedCLIP-PubMedBERT_256-vit_base_patch16_224
BiomedCLIP-PubMedBERT_256-vit_base_patch16_224は、PubMed Central由来の1500万件の医用画像とキャプション対で事…
❤ 404 ↓ 894.6k mit 2025-01-14
マルチモーダル
GitHub GLM-skills
「zai-org/GLM-skills」は、GLMモデルファミリー向けの公式スキルセットを統合したリポジトリです。Claude Code、Ope…
★ 386 ⑂ 29 Apache-2.0 2026-04-15
マルチモーダル GitHub antfly
Antflyは、etcdのRaftライブラリを基盤とした分散型検索エンジンです。フルテキスト検索(BM25)、ベクトル類似性、…
★ 357 ⑂ 25 NOASSERTION 2026-05-14
マルチモーダル GitHub Awesome-Multimodal-Modeling
このリポジトリは、マルチモーダルモデリングに関する包括的な調査と厳選されたリストです。伝統的なマルチモーダル…
★ 327 ⑂ 17 2026-05-09
マルチモーダル
HF Qwen3.6-27B-Uncensored-HauhauCS-Aggressive
Qwen3.6-27Bをベースに、応答拒否を抑えたGGUF配布モデルです。Aggressive版は過激な指示でも前置きや言い訳を減らし…
❤ 312 ↓ 481.8k apache-2.0 2026-04-24
マルチモーダル HF sam3.1
SAM 3.1は、Metaの画像・動画向けプロンプト可能セグメンテーション基盤モデルSAM 3の改良版チェックポイントです。…
❤ 246 ↓ 269.9k other 2026-03-27
マルチモーダル
GitHub autoresearch-qwen
autoresearch-qwenは、Qwen3-VL-4B-InstructモデルをDocumentVQAベンチマークで自律的に改善することを目的とした研…
★ 209 ⑂ 33 MIT 2026-05-12
マルチモーダル GitHub WindsurfPoolAPI
このツールは、Windsurf AIプラットフォーム向けのエンタープライズ級マルチアカウントプールプロキシ「WindsurfPool…
★ 209 ⑂ 51 MIT 2026-04-26
マルチモーダル GitHub awesome-agentic-world-modeling
「Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond」という論文に付随するリポジトリで、Agen…
★ 209 ⑂ 5 MIT 2026-05-11
マルチモーダル GitHub knowledgeops-agent
「KnowledgeOps Agent」は、Spring AIを基盤としたエンタープライズ向けのマルチエージェントAIプラットフォームです…
★ 208 ⑂ 11 MIT 2026-05-12
マルチモーダル HF audio-flamingo-3-hf
Audio Flamingo 3は、音声・環境音・音楽を横断して理解し、文字起こし、音の内容把握、推論、対話まで行えるオープ…
❤ 183 ↓ 178.6k other 2026-04-13
マルチモーダル
HF nemotron-ocr-v2
Nemotron OCR v2は、複雑な実写画像や文書画像から文字を高精度かつ高速に抽出する、NVIDIAの商用利用可能な多言語OC…
❤ 179 ↓ 2.4k other 2026-04-28
マルチモーダル GitHub OpenSearch-VL
OpenSearch-VLは、最先端のマルチモーダル深層検索エージェントを訓練するためのオープンソースのレシピです。単一の…
★ 175 ⑂ 14 Apache-2.0 2026-05-13
画像生成 GitHub DISCO
DISCOは、タンパク質配列と3次元構造を同時に設計できる拡散ベースのマルチモーダル生成モデルです。小分子リガンド…
★ 174 ⑂ 20 Apache-2.0 2026-04-09