概要
VibeVoice ComfyUI Nodesは、MicrosoftのVibeVoiceテキスト読み上げモデルをComfyUIに統合するツールです。
これにより、ComfyUIのワークフロー内で高品質な単一話者および複数話者(最大4人)の音声合成を直接実行できます。
音声クローニング、LoRAサポートによるボイスの微調整、音声速度制御、テキストファイルからのスクリプト読み込み、自動テキストチャンク処理、カスタム一時停止タグなど、豊富な機能を備えています。
パフォーマンス最適化として、各種アテンションメカニズムの選択、拡散ステップの調整、VRAM管理機能、Apple Silicon (MPS) のサポート、8ビット/4ビット量子化によるVRAM削減も可能です。
ComfyUIユーザーで、VibeVoiceモデルを使った高度な音声合成を求めるクリエイターや開発者に適しています。
互換性・特徴
- ComfyUI対応
- 音声合成
- GPU対応
- Apple Silicon対応
- クロスプラットフォーム
- Python
基本情報
| ライセンス | MIT |
| Stars | 1,502 |
| Forks | 241 |
| カテゴリ | ComfyUI |
| アクティビティ | mid |
最新のissue
- VibeVoiceシングルスピーカーノードにモデルが表示されない (更新: 2026-05-19 / Model not listed in VibeVoice single speaker node)
- 新規Comfyuiポータブルインストールでのエラー: VibeVoiceモデルロード失敗、’VibeVoiceAcousticTokenizerConfig’は既に使用済み。 (更新: 2026-05-19 / Error in new Comfyui portable installation "Failed to load VibeVoice model: ‘<class ‘modular.configuration_vibevoice.VibeVoiceAcousticTokenizerConfig’>’ is already used by a Transformers model.")
- Speech-To-Speech機能の提供について検討中ですか? (更新: 2026-04-07 / Speech-To-Speech?)
- ノードがトークナイザーのインターネット接続を強制 (2つの回避策あり)。 (更新: 2026-04-04 / The node forces internet call for tokenizer (2 work-arounds))
最新リリース: v1.8.1 – Critical Bitsandbytes Fix (2025-10-02)
