画像生成 HF stable-diffusion-xl-base-1.0
このモデルはStability AIが開発した、テキストプロンプトから画像を生成・修正する拡散ベースの画像生成AI「Stable …
❤ 7.9k ↓ 1.3M openrail++ 2023-10-30
ASR / 音声認識 HF whisper-large-v3
Whisper large-v3は、OpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルです。500万時間以上の学習…
❤ 5.9k ↓ 5.7M apache-2.0 2024-08-12
画像生成 HF Z-Image-Turbo
Z-Imageは、60億パラメータを持つ高効率な画像生成モデルファミリーです。特にZ-Image-Turboは、わずか8NFEsでサブ秒…
❤ 4.9k ↓ 891.8k apache-2.0 2026-01-30
音声生成 / TTS HF XTTS-v2
XTTS-v2は、Coquiが開発した高度な音声生成モデルです。わずか6秒の短い音声クリップを用いることで、既存の声を17種…
❤ 3.6k ↓ 9.4M other 2023-12-11
画像生成 HF sdxl-turbo
SDXL-Turboは、Stability AIが開発した高速な生成テキストから画像へのモデルです。リアルタイム合成に特化しており…
❤ 2.6k ↓ 632.4k other 2024-07-10
動画生成 HF HunyuanVideo
HunyuanVideoは、Tencentが公開した大規模な動画生成基盤モデルの実装リポジトリです。PyTorch製のモデル定義、学習…
❤ 2.2k ↓ 902 other 2025-03-06
画像生成 HF stable-diffusion-xl-refiner-1.0
Stability AIが開発した「SD-XL 1.0-refiner」は、テキストプロンプトから画像を生成・変更できる拡散ベースの画像生…
❤ 2.0k ↓ 167.9k openrail++ 2023-09-25
マルチモーダル HF Qwen3.6-27B
Qwen3.6-27Bは、Hugging Face Transformers形式で提供されるオープンウェイトの大規模マルチモーダルモデルです。画…
❤ 1.8k ↓ 5.6M apache-2.0 2026-04-24
動画生成 HF LTX-2
LTX-2は、Lightricksが開発したDiTベースのオーディオ・ビデオ基盤モデルです。単一のモデル内で同期されたビデオと…
❤ 1.8k ↓ 552.4k other 2026-03-02
マルチモーダル HF Gemma-4-31B-JANG_4M-CRACK
Gemma 4 31BベースのMLX向けマルチモーダル言語モデルで、画像入力を含む対話やコード生成、一般用途のアシスタント…
❤ 1.7k ↓ 42.7k gemma 2026-04-25
音声生成 / TTS HF chatterbox
Chatterboxは、Resemble AIが開発したオープンソースの高品質なテキスト読み上げ(TTS)モデルです。23言語に対応し…
❤ 1.7k ↓ 2.2M mit 2026-06-10
音声生成 / TTS HF Qwen3-TTS-12Hz-1.7B-CustomVoice
Qwen3-TTSは、テキストを音声に変換する先進的なモデルで、中国語、英語、日本語を含む10の主要言語と複数の方言プロ…
❤ 1.6k ↓ 2.0M apache-2.0 2026-01-29
動画生成 HF Wan2.1-T2V-14B
Wan2.1-T2V-14Bは、テキストから高品質な動画を生成する大規模オープンモデルです。480Pと720Pの両方に対応し、動き…
❤ 1.5k ↓ 59.7k apache-2.0 2025-03-12
動画生成 HF LTX-2.3
LTX-2.3は、Lightricksが公開する音声と映像を同時生成できるDiTベースのオープンウェイト基盤モデルです。画像から…
❤ 1.5k ↓ 1.8M other 2026-04-13
LLM HF Qwen2.5-7B-Instruct
Qwen2.5-7B-Instructは、Qwen大規模言語モデルの最新シリーズであり、特に命令チューニングされた7Bモデルです。コー…
❤ 1.4k ↓ 12.7M apache-2.0 2025-01-12
画像生成 HF Qwen-Image-Layered
Qwen-Image-Layeredは、入力画像を複数のRGBAレイヤーに分解し、各レイヤーを独立して編集できる画像処理モデルです…
❤ 1.1k ↓ 51.1k apache-2.0 2025-12-19
音声生成 / TTS HF OmniVoice
OmniVoiceは、600以上の言語に対応する多言語ゼロショットテキスト音声合成(TTS)モデルです。独自の拡散言語モデル…
❤ 1.1k ↓ 1.0M apache-2.0 2026-05-07
画像生成 HF Qwen-Image-Edit-2511
Qwen-Image-Edit-2511は、Qwen-Image-Edit-2509を強化した画像編集モデルです。画像ドリフトの軽減、キャラクターの…
❤ 1.1k ↓ 176.3k apache-2.0 2025-12-23
動画生成 HF AnimateDiff-Lightning
AnimateDiff-Lightningは、AnimateDiffをベースに高速化したテキストから動画を生成する研究モデルです。1・2・4・8…
❤ 992 ↓ 12.2k creativeml-openrail-m 2025-01-06
画像生成 HF FLUX.2-klein-9B
FLUX.2 [klein] 9Bは、Black Forest Labsの高速画像生成・編集モデルです。テキストからの画像生成と、単一参照・複…
❤ 969 ↓ 167.4k other 2026-02-24
マルチモーダル HF Qwen3.6-27B-GGUF
Qwen3.6-27B-GGUFは、Qwen3.6-27Bをもとにしたオープンウェイトの大規模言語・視覚対応モデルで、コード生成、リポジ…
❤ 823 ↓ 555.2k apache-2.0 2026-04-22
画像生成 HF FLUX.2-klein-4B
FLUX.2 [klein] 4Bは、Black Forest Labsが開発した高速画像生成モデルです。テキストからの画像生成と画像編集機能…
❤ 760 ↓ 503.6k apache-2.0 2026-02-24
動画生成 HF text-to-video-ms-1.7b
本モデルは、テキストの記述に基づいて動画を生成するマルチステージのテキストから動画生成拡散モデルです。約17億…
❤ 666 ↓ 108.4k cc-by-nc-4.0 2023-12-01
マルチモーダル HF BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 600 ↓ 719.6k mit 2026-02-04