3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

#CLI (1751 repos)

「CLI」タグが付いたリポジトリ

← 全リポジトリ

マルチモーダル
HF
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive
Qwen3.6-35B-A3Bをベースに、拒否応答を極力外したHauhauCS製のGGUF配布モデルです。テキストに加えて画像・動画も扱…
❤ 2.3k ↓ 3.3M apache-2.0 2026-04-17
マルチモーダル
HF
GLM-OCR
GLM-OCRは、複雑な文書を高精度に読み取り・解析できるマルチモーダルOCRモデルです。数式、表、情報抽出まで対応し…
❤ 1.9k ↓ 3.2M mit 2026-05-19
マルチモーダル
HF
Qwen3.6-27B
Qwen3.6-27Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダルモデルです。画…
❤ 1.8k ↓ 5.6M apache-2.0 2026-04-24
マルチモーダル
HF
Qwen3.6-35B-A3B-GGUF
Qwen3.6-35B-A3B-GGUFは、Unslothが提供するQwen3.6系の量子化モデル配布で、コーディング支援やツール呼び出し、画…
❤ 1.3k ↓ 917.7k apache-2.0 2026-04-20
音声生成 / TTS
HF
supertonic-3
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。ONNX Runtimeベースで動作し、…
❤ 854 ↓ 51.2k openrail 2026-05-18
動画生成
HF
LTX-2.3-GGUF
unsloth/LTX-2.3-GGUFは、LightricksのLTX-2.3をGGUF量子化し、ComfyUI上でローカル実行しやすくした音声付き動画生…
❤ 478 ↓ 300.6k other 2026-04-20
マルチモーダル
HF
YOLOv8
Ultralytics YOLOv8は、物体検出を中心に、追跡、インスタンスセグメンテーション、画像分類、姿勢推定、OBBまで幅広…
❤ 370 ↓ 9.3k agpl-3.0 2026-06-26
画像生成
HF
Qwen3.5-9B-Claude-4.6-Opus-Reasoning-Distilled-GGUF
Qwen3.5-9Bをベースに、Claude 4.6 Opus由来の推論データを蒸留してSFT+LoRAで強化した推論特化モデルです。`<think>…
❤ 329 ↓ 187.1k apache-2.0 2026-04-06
マルチモーダル
HF
audio-flamingo-3-hf
Audio Flamingo 3は、音声・環境音・音楽を横断して理解し、文字起こし、音の内容把握、推論、対話まで行えるオープ…
❤ 187 ↓ 263.1k other 2026-04-13
動画生成
HF
Matrix-Game-3.0
Matrix-Game 3.0は、画像とテキストを入力に、長時間の一貫性を保った720pインタラクティブ動画をリアルタイム生成で…
❤ 123 ↓ 255 apache-2.0 2026-04-28
マルチモーダル
HF
Falcon-OCR
Falcon OCRは、3億パラメータを持つ早期結合型ビジョン・言語モデルで、文書のOCR(光学文字認識)に特化しています…
❤ 119 ↓ 5.6k apache-2.0 2026-05-13
マルチモーダル
HF
tipsv2-b14
TIPSv2 B/14は、画像とテキストを同じ埋め込み空間で扱えるGoogle系の視覚言語モデルです。画像全体の特徴量だけでな…
❤ 112 ↓ 12.1k apache-2.0 2026-06-27
マルチモーダル
HF
music-flamingo-2601-hf
Music Flamingoは、音楽や楽曲の理解に特化したNVIDIAの大規模音声言語モデルです。曲調、テンポ、キー、楽器構成、…
❤ 105 ↓ 188.9k other 2026-04-09
マルチモーダル
HF
music-flamingo-hf
Music Flamingoは、楽曲やインストゥルメンタル音源を対象に、ジャンル・テンポ・キー・楽器構成・雰囲気・歌詞や文…
❤ 99 ↓ 16.8k other 2026-04-04
マルチモーダル
HF
MOSS-VL-Instruct-0408
MOSS-VL-Instruct-0408は、OpenMOSS系の視覚言語モデルを教師あり微調整したマルチモーダル推論用チェックポイントで…
❤ 97 ↓ 331 apache-2.0 2026-04-22
画像生成
HF
PixelSmile
PixelSmileは、既存の顔画像に対して笑顔・喜びなどの表情を細かく編集するための画像生成・編集モデルです。Qwen-Im…
❤ 90 ↓ 747 apache-2.0 2026-05-08
マルチモーダル
HF
MOSS-Audio-8B-Thinking
MOSS-Audio-8B-Thinkingは、音声・環境音・音楽を横断的に理解できるオープンソースの音声理解モデルです。文字起こ…
❤ 76 ↓ 5.2k apache-2.0 2026-06-11
マルチモーダル
HF
MOSS-Audio-4B-Instruct
MOSS-Audio-4B-Instructは、音声・環境音・音楽を統合的に理解し、テキストで応答するオープンソースの音声理解モデ…
❤ 73 ↓ 17.1k apache-2.0 2026-04-14
マルチモーダル
HF
MOSS-VL-Base-0408
MOSS-VL-Base-0408は、OpenMOSS系の画像・動画理解向けマルチモーダル基盤モデルです。4段階の事前学習のみで構築さ…
❤ 61 ↓ 1.3k apache-2.0 2026-04-23
マルチモーダル
HF
audio-flamingo-next-hf
Audio Flamingo Nextは、音声・環境音・音楽をまとめて理解できるNVIDIAの大規模音声言語モデルです。音声Q&A、文字…
❤ 56 ↓ 8.0k other 2026-05-13
マルチモーダル
HF
MOSS-Audio-8B-Instruct
MOSS-Audio-8B-Instructは、音声・環境音・音楽をまとめて理解できるオープンソースの音声理解モデルです。音声認識…
❤ 44 ↓ 5.0k apache-2.0 2026-06-11
マルチモーダル
HF
music-flamingo-think-2601-hf
Music Flamingo Thinkは、音楽や楽曲音声を入力として詳細な説明や質疑応答を行えるNVIDIAの音声言語モデルです。ジ…
❤ 41 ↓ 533 other 2026-04-07
マルチモーダル
HF
MOSS-Audio-4B-Thinking
MOSS-Audio-4B-Thinkingは、音声・環境音・音楽をまとめて理解し、文字起こし、話者や感情の分析、音の状況把握、要…
❤ 33 ↓ 4.0k apache-2.0 2026-04-14
画像生成
HF
SpatialEdit-16B
SpatialEdit-16Bは、入力画像に対して文章指示で位置や向き、視点を細かく調整できる研究用の画像空間編集モデルです…
❤ 17 ↓ 23 apache-2.0 2026-04-08