音声生成 / TTS GitHub BigVGAN
BigVGANは、NVIDIAが開発したユニバーサルなニューラルボコーダーであり、ICLR 2023で発表されました。大規模なデー…
★ 1.2k ⑂ 145 MIT 2024-09-05
動画生成 GitHub HunyuanCustom
HunyuanCustomは、画像、音声、ビデオ、テキストといった多様な入力モダリティを活用し、特定の被写体が登場するカス…
★ 1.2k ⑂ 110 NOASSERTION 2025-10-15
ComfyUI GitHub comfyui-inpaint-nodes
ComfyUI向けに高品質なインペイント機能を提供するノード集です。Fooocusインペイントモデル(SDXL対応)、LaMa、MAT…
★ 1.2k ⑂ 74 GPL-3.0 2026-05-31
ComfyUI GitHub ComfyUI-segment-anything-2
このツールは、ComfyUIでSegment Anything 2モデルを使用するためのノードを提供します。現在開発中のPointsEditor機…
★ 1.2k ⑂ 83 Apache-2.0 2025-09-28
ComfyUI GitHub RES4LYF
RES4LYFは、ComfyUI向けの先進的な画像生成サンプラーとユーティリティのコレクションです。独自のノイズスケーリン…
★ 1.2k ⑂ 113 NOASSERTION 2026-06-15
画像生成 HF Qwen-Image-Layered
Qwen-Image-Layeredは、入力画像を複数のRGBAレイヤーに分解し、各レイヤーを独立して編集できる画像処理モデルです…
❤ 1.1k ↓ 51.1k apache-2.0 2025-12-19
音声生成 / TTS HF OmniVoice
OmniVoiceは、600以上の言語に対応する多言語ゼロショットテキスト音声合成(TTS)モデルです。独自の拡散言語モデル…
❤ 1.1k ↓ 1.0M apache-2.0 2026-05-07
画像生成 HF Qwen-Image-Edit-2511
Qwen-Image-Edit-2511は、Qwen-Image-Edit-2509を強化した画像編集モデルです。画像ドリフトの軽減、キャラクターの…
❤ 1.1k ↓ 176.3k apache-2.0 2025-12-23
動画生成 HF AnimateDiff-Lightning
AnimateDiff-Lightningは、AnimateDiffをベースに高速化したテキストから動画を生成する研究モデルです。1・2・4・8…
❤ 992 ↓ 12.2k creativeml-openrail-m 2025-01-06
ComfyUI GitHub ComfyUI_VNCCS
VNCCS(Visual Novel Character Creation Suite)は、視覚ノベル用のキャラクター画像を生成するための包括的なComfy…
★ 991 ⑂ 65 MIT 2026-06-26
画像生成 GitHub Irodori-TTS
Irodori-TTSは、Flow Matching技術を用いたテキスト音声合成モデルで、絵文字によるスタイル制御が可能です。参照音…
★ 980 ⑂ 111 MIT 2026-06-04
動画生成 GitHub PIA
PIA (Personalized Image Animator) は、CVPR 2024で発表された、テキストプロンプトとパーソナライズモデルを組み合…
★ 973 ⑂ 73 Apache-2.0 2024-08-05
画像生成 HF FLUX.2-klein-9B
FLUX.2 [klein] 9Bは、Black Forest Labsの高速画像生成・編集モデルです。テキストからの画像生成と、単一参照・複…
❤ 969 ↓ 167.4k other 2026-02-24
動画生成 GitHub SEINE
SEINEは、ICLR 2024で発表された、短い動画から長い動画を生成するビデオ拡散モデルです。動画の遷移生成や予測、画…
★ 967 ⑂ 65 Apache-2.0 2024-11-13
動画生成 GitHub Bernini
Berniniは、MLLMベースのセマンティックプランナーとDiTベースのレンダラーを組み合わせた、ビデオ生成および編集の…
★ 954 ⑂ 74 Apache-2.0 2026-06-22
ComfyUI GitHub ComfyUI-MultiGPU
「ComfyUI-MultiGPU v2」は、人気のある画像生成UI「ComfyUI」用のカスタムノードです。UNetやCLIPローダー、WanVide…
★ 907 ⑂ 70 GPL-3.0 2026-05-08
マルチモーダル HF Qwen3.6-27B-GGUF
Qwen3.6-27B-GGUFは、Qwen3.6-27Bをもとにしたオープンウェイトの大規模言語・視覚対応モデルで、コード生成、リポジ…
❤ 823 ↓ 555.2k apache-2.0 2026-04-22
動画生成 GitHub Causal-Forcing
「Causal Forcing」およびその改良版「Causal Forcing++」は、因果ODEや因果Consistency Distillationを活用し、高品…
★ 803 ⑂ 46 Apache-2.0 2026-06-17
画像生成 HF FLUX.2-klein-4B
FLUX.2 [klein] 4Bは、Black Forest Labsが開発した高速画像生成モデルです。テキストからの画像生成と画像編集機能…
❤ 760 ↓ 503.6k apache-2.0 2026-02-24
ComfyUI GitHub ComfyUI-FlashVSR_Ultra_Fast
ComfyUI-FlashVSR_Ultra_Fastは、Diffusionベースのリアルタイム動画ストリーミング超解像モデルです。低いVRAM環境…
★ 748 ⑂ 32 GPL-3.0 2025-11-20
ComfyUI GitHub ComfyUI-Inspyrenet-Rembg
このツールは、人気の画像生成UI「ComfyUI」のカスタムノードであり、AIを用いた高品質な画像背景除去機能を提供しま…
★ 740 ⑂ 44 MIT 2024-07-31
LLM GitHub OPD
このツールは、大規模言語モデル(LLM)のオンポリシー蒸留(OPD)のメカニズムとダイナミクスを系統的に調査する研…
★ 736 ⑂ 47 2026-06-29
ComfyUI GitHub ComfyUI-DynamiCrafterWrapper
このリポジトリは、ComfyUIで画像から動画を生成する「DynamiCrafter」および「ToonCrafter」モデルを利用するための…
★ 680 ⑂ 35 NOASSERTION 2025-06-02
動画生成 GitHub SparkVSR
SparkVSRは、インタラクティブな動画超解像(VSR)フレームワークです。ユーザーが任意の画像超解像(ISR)モデルで…
★ 678 ⑂ 73 Apache-2.0 2026-06-23