概要
ComfyUI上でStableAvatarを使い、音声に合わせてアバター動画を生成するためのカスタムノードです。
音声の長さに応じて長時間の動画を扱える点が特徴で、歌声向けの音声分離やLoRAによる高速推論、GPUメモリ設定の調整にも対応します。
必要モデルをHugging Faceなどから配置して使う構成で、ComfyUI利用者やGPU環境を持つ動画生成・VTuber風表現の制作者向けです。
互換性・特徴
- ComfyUI対応
- GPU必須
- Python
- Web UI
- カスタムノード
- LoRA対応
基本情報
| ライセンス | MIT |
| Stars | 42 |
| Forks | 6 |
| カテゴリ | ComfyUI |
| アクティビティ | low |
最新のissue
- [Bug] Stepsが3未満でないと、長時間生成(5秒超)で映像出力が空白・黒画面になる (更新: 2025-12-14 / [Bug] Blank/Black Video Output on Long Generation (>5s) unless Steps < 3)
- すべてのtensorが同じdevice上にある想定ですが、cuda:0とcpuの少なくとも2つのdeviceが見つかりました (更新: 2025-09-20 / Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu!)
- StableAvatar_LoadModel の ‘in_dim’ に関する不具合 (更新: 2025-08-22 / StableAvatar_LoadModel ‘in_dim’)
- stableavatarでmulti-gpuを設定する方法は? (更新: 2025-08-20 / how to config multi-gpu for stableavatar?)
- 生成されたキャラクターに目立つ揺れがある (更新: 2025-08-20 / The generated character has obvious jitter)