3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

全AIリポジトリ

登録されているAI関連OSSの一覧

画像生成
HF
stable-diffusion-xl-base-1.0
このモデルはStability AIが開発した、テキストプロンプトから画像を生成・修正する拡散ベースの画像生成AI「Stable …
❤ 7.9k ↓ 1.3M openrail++ 2023-10-30
音声生成 / TTS
HF
Kokoro-82M
Kokoroは、わずか8200万パラメータの軽量ながら、大規模なモデルに匹敵する高品質な音声合成(TTS)を提供するオープ…
❤ 6.4k ↓ 15.8M apache-2.0 2025-04-10
ASR / 音声認識
HF
whisper-large-v3
Whisper large-v3は、OpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルです。500万時間以上の学習…
❤ 5.9k ↓ 5.7M apache-2.0 2024-08-12
画像生成
HF
Z-Image-Turbo
Z-Imageは、60億パラメータを持つ高効率な画像生成モデルファミリーです。特にZ-Image-Turboは、わずか8NFEsでサブ秒…
❤ 4.9k ↓ 891.8k apache-2.0 2026-01-30
音声生成 / TTS
HF
XTTS-v2
XTTS-v2は、Coquiが開発した高度な音声生成モデルです。わずか6秒の短い音声クリップを用いることで、既存の声を17種…
❤ 3.6k ↓ 9.4M other 2023-12-11
LLM
HF
gpt2
GPT-2は、大規模な英語コーパスで事前学習されたTransformerベースの言語モデルです。文章の次の単語を予測するよう…
❤ 3.3k ↓ 13.0M mit 2024-02-19
ASR / 音声認識
HF
whisper-large-v3-turbo
Whisper large-v3-turboは、OpenAIが提案する最先端の自動音声認識(ASR)および音声翻訳モデルであるWhisper large-…
❤ 3.1k ↓ 7.4M mit 2024-10-04
マルチモーダル
HF
gemma-4-31B-it
Gemma 4 31B itは、Google DeepMindのオープンウェイトな命令調整済みマルチモーダルモデルです。テキストと画像を入…
❤ 3.1k ↓ 11.1M apache-2.0 2026-06-03
画像生成
HF
sdxl-turbo
SDXL-Turboは、Stability AIが開発した高速な生成テキストから画像へのモデルです。リアルタイム合成に特化しており…
❤ 2.6k ↓ 632.4k other 2024-07-10
マルチモーダル
HF
sam3
SAM 3は、画像と動画に対してプロンプト可能なセグメンテーションを行う統合基盤モデルです。短いテキスト、点、ボッ…
❤ 2.3k ↓ 1.7M other 2025-11-20
マルチモーダル
HF
Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive
Qwen3.6-35B-A3Bをベースに、拒否応答を極力外したHauhauCS製のGGUF配布モデルです。テキストに加えて画像・動画も扱…
❤ 2.3k ↓ 3.3M apache-2.0 2026-04-17
動画生成
HF
HunyuanVideo
HunyuanVideoは、Tencentが公開した大規模な動画生成基盤モデルの実装リポジトリです。PyTorch製のモデル定義、学習…
❤ 2.2k ↓ 902 other 2025-03-06
画像生成
HF
stable-diffusion-xl-refiner-1.0
Stability AIが開発した「SD-XL 1.0-refiner」は、テキストプロンプトから画像を生成・変更できる拡散ベースの画像生…
❤ 2.0k ↓ 167.9k openrail++ 2023-09-25
マルチモーダル
HF
clip-vit-large-patch14
OpenAIが開発したCLIPモデルは、画像とテキストの関連性を学習し、未知の画像分類タスクに対してゼロショットで高い…
❤ 2.0k ↓ 11.8M 2023-09-15
マルチモーダル
HF
RMBG-1.4
BRIA Background Removal v1.4は、画像内の前景を高精度に切り出して背景を除去できる画像セグメンテーションモデル…
❤ 2.0k ↓ 331.9k other 2025-07-06
マルチモーダル
HF
GLM-OCR
GLM-OCRは、複雑な文書を高精度に読み取り・解析できるマルチモーダルOCRモデルです。数式、表、情報抽出まで対応し…
❤ 1.9k ↓ 3.2M mit 2026-05-19
マルチモーダル
HF
Qwen3.6-27B
Qwen3.6-27Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダルモデルです。画…
❤ 1.8k ↓ 5.6M apache-2.0 2026-04-24
動画生成
HF
Sulphur-2-base
Sulphur 2は、LTX 2.3をベースにした無修正の動画生成AIモデルです。Text-to-Video(テキストから動画)およびImage-…
❤ 1.8k ↓ 816.1k 2026-06-24
動画生成
HF
LTX-2
LTX-2は、Lightricksが開発したDiTベースのオーディオ・ビデオ基盤モデルです。単一のモデル内で同期されたビデオと…
❤ 1.8k ↓ 552.4k other 2026-03-02
マルチモーダル
HF
Gemma-4-31B-JANG_4M-CRACK
Gemma 4 31BベースのMLX向けマルチモーダル言語モデルで、画像入力を含む対話やコード生成、一般用途のアシスタント…
❤ 1.7k ↓ 42.7k gemma 2026-04-25
音声生成 / TTS
HF
chatterbox
Chatterboxは、Resemble AIが開発したオープンソースの高品質なテキスト読み上げ(TTS)モデルです。23言語に対応し…
❤ 1.7k ↓ 2.2M mit 2026-06-10
音声生成 / TTS
HF
Qwen3-TTS-12Hz-1.7B-CustomVoice
Qwen3-TTSは、テキストを音声に変換する先進的なモデルで、中国語、英語、日本語を含む10の主要言語と複数の方言プロ…
❤ 1.6k ↓ 2.0M apache-2.0 2026-01-29
動画生成
HF
Wan2.1-T2V-14B
Wan2.1-T2V-14Bは、テキストから高品質な動画を生成する大規模オープンモデルです。480Pと720Pの両方に対応し、動き…
❤ 1.5k ↓ 59.7k apache-2.0 2025-03-12