動画生成 HF text-to-video-ms-1.7b
本モデルは、テキストの記述に基づいて動画を生成するマルチステージのテキストから動画生成拡散モデルです。約17億…
❤ 666 ↓ 108.4k cc-by-nc-4.0 2023-12-01
LLM GitHub can-i-finetune-this
canifinetuneは、コンシューマー向けNVIDIA GPU(12-24GB)で大規模言語モデル(LLM)のファインチューニングを検討…
★ 649 ⑂ 92 MIT 2026-06-10
画像生成 GitHub nano-world-model
「Nano World Model」は、拡散強制(diffusion-forcing)に基づくビデオワールドモデルのトレーニングに特化した、シ…
★ 643 ⑂ 33 MIT 2026-06-15
マルチモーダル HF BiRefNet
BiRefNetは、高解像度画像向けの二値画像セグメンテーションモデルの公式実装です。背景除去やマスク生成を主用途と…
❤ 600 ↓ 719.6k mit 2026-02-04
ComfyUI GitHub ComfyUI-VibeVoice
ComfyUI-VibeVoiceは、MicrosoftのVibeVoiceをComfyUIに統合するカスタムノードです。表現力豊かで長尺なマルチスピ…
★ 587 ⑂ 108 MIT 2025-09-25
ComfyUI GitHub ComfyUI-IDM-VTON
ComfyUI-IDM-VTONは、IDM-VTONのComfyUI向け適応版で、画像を用いたバーチャル試着を実現するツールです。ComfyUI環…
★ 586 ⑂ 68 GPL-3.0 2024-08-20
ComfyUI GitHub ComfyUI-Kolors-MZ
ComfyUI上でKwai-Kolorsモデルを利用可能にするためのカスタムノードとワークフローを提供するツールです。ComfyUIの…
★ 584 ⑂ 38 GPL-3.0 2025-03-31
ComfyUI GitHub ComfyUI-Marigold
ComfyUI-Marigoldは、画像から深度マップを推定するMarigoldモデルのComfyUI向けラッパーノードです。このツールは、…
★ 572 ⑂ 25 GPL-3.0 2025-05-16
ComfyUI GitHub ComfyUI-AnimateAnyone-Evolved
本ツールは、AnimateAnyoneの実装を改良し、ポーズ画像シーケンスと参照画像を基にスタイライズされた動画を生成しま…
★ 560 ⑂ 50 MIT 2024-06-14
マルチモーダル HF Voxtral-Small-24B-2507
Voxtral Small 1.0(24B)は、Mistral Small 3系をベースに音声入力機能を強化した大規模音声理解モデルです。音声の…
❤ 501 ↓ 105.6k apache-2.0 2025-12-20
3D / NeRF GitHub Scal3R
Scal3Rは、CVPR 2026のHighlight論文として発表された、大規模な3D再構築のためのスケーラブルなテスト時学習手法で…
★ 494 ⑂ 37 NOASSERTION 2026-05-11
動画生成 GitHub Google-Colab_Notebooks
このリポジトリは、様々なAIプロジェクトのためのGoogle Colabノートブック集です。特に、ビジュアルプログラミング…
★ 483 ⑂ 167 2026-06-20
画像生成 GitHub PixelSmile
PixelSmileは、顔の表情を連続的に制御しながら、微調整された編集を可能にするツールです。既存の顔の同一性を強く…
★ 478 ⑂ 22 Apache-2.0 2026-04-22
動画生成 HF LTX-2.3-GGUF
unsloth/LTX-2.3-GGUFは、LightricksのLTX-2.3をGGUF量子化し、ComfyUI上でローカル実行しやすくした音声付き動画生…
❤ 478 ↓ 300.6k other 2026-04-20
画像生成 HF Z-Anime
Z-Animeは、AlibabaのZ-Image Baseを土台にしたアニメ画像生成向けのフルファインチューニングモデル群です。LoRAマ…
❤ 461 ↓ 1.9k apache-2.0 2026-04-27
音声生成 / TTS GitHub Confucius4-TTS
Confucius4-TTSは、LLMと音声エンコーダをベースにした、多言語・異言語対応のゼロショット音声合成エンジンです。「…
★ 448 ⑂ 45 NOASSERTION 2026-06-17
LLM GitHub orthrus
Orthrusは、大規模言語モデル(LLM)の推論を高速化するためのデュアルアーキテクチャフレームワークです。自己回帰…
★ 446 ⑂ 19 MIT 2026-05-18
画像生成 GitHub Bonsai-Image-Demo
Bonsai Image Demoは、Apple Silicon (macOS) またはNVIDIA GPU (Linux/Windows) を利用して、ローカルで画像を生成…
★ 444 ⑂ 58 Apache-2.0 2026-06-14
画像生成 HF Flux2-Klein-9B-Consistency
Flux2-Klein-9B-Consistencyは、black-forest-labs/FLUX.2-klein-9B向けのLoRAで、追加のキーワードなしでもキャラク…
❤ 436 ↓ 36.3k apache-2.0 2026-04-19
ComfyUI GitHub ComfyUI-OmniVoice-TTS
ComfyUI-OmniVoice-TTSは、画像生成AIのComfyUI向けに開発された、ゼロショット多言語テキスト読み上げ(TTS)ノード…
★ 434 ⑂ 56 Apache-2.0 2026-06-11
画像生成 GitHub verl-omni
VeRL-Omniは、拡散モデルやオムニモダリティモデルといったマルチモーダル生成モデルに特化した強化学習(RL)トレー…
★ 431 ⑂ 63 Apache-2.0 2026-06-26
LLM GitHub KVarN
KVarNは、LLMのKVキャッシュ量子化をvLLM環境で実現するネイティブバックエンドです。特に、エージェントや長文コン…
★ 419 ⑂ 27 Apache-2.0 2026-06-22
3D / NeRF HF HY-Motion-1.0
「HY-Motion 1.0」は、Tencentが開発した、テキストプロンプトから3Dヒューマンモーションを生成するための最先端モ…
❤ 418 ↓ 483 other 2025-12-31
マルチモーダル GitHub VEGA-3D
VEGA-3Dは、「Generation Models Know Space: Unleashing Implicit 3D Priors for Scene Understanding」の公式実装…
★ 418 ⑂ 23 Apache-2.0 2026-06-18