概要
rookiestar28/ComfyUI-LongCat-Avatarは、ComfyUI用のカスタムノード集で、LongCat Video Avatar 1.5のオーディオ駆動型人間ビデオ生成パイプラインを実装しています。
NVIDIA GPUとCUDA環境に特化しており、Whisper-large-v3による高度な音声条件付け、distill LoRA推論、シングルおよびマルチオーディオからのアバター生成をサポートします。
また、多様なDiTモデル(.safetensors、シャード、INT8)の読み込みや、公式チェックポイント資産の自動ダウンロード機能を提供します。
ComfyUI環境でオーディオからリアルな人間のアバター動画を効率的に作成したいクリエイターや開発者に最適です。
互換性・特徴
- ComfyUI対応
- GPU必須
- Python
- AI/ML (推論)
- オーディオ処理
- ビデオ生成
基本情報
| ライセンス | MIT |
| Stars | 17 |
| Forks | 1 |
| カテゴリ | ComfyUI |
| アクティビティ | low |
最新のissue
- OOMエラー 12GB VRAM (更新: 2026-06-11 / OOM Error 12GB VRAM)
最新リリース: Initial Release (2026-06-10)
GitHub: https://github.com/rookiestar28/ComfyUI-LongCat-Avatar