概要
ComfyUI-OmniVoice-TTSは、画像生成AIのComfyUI向けに開発された、ゼロショット多言語テキスト読み上げ(TTS)ノードです。
最先端の音声クローニングと音声デザイン機能を備え、600以上の言語に対応しています。
短時間の参照音声から任意の声をクローンしたり、テキスト記述(性別、年齢、ピッチ、アクセントなど)に基づいて合成音声を生成したりできます。
複数の話者による対話生成や非言語的表現の追加も可能です。
高速な推論とVRAM効率に優れた設計が特徴で、ComfyUIユーザーが高度な音声合成機能を容易に利用できることを想定しています。
互換性・特徴
- ComfyUI対応
- GPU必須
- 多言語対応
- 音声クローニング
- 音声デザイン
- Python
基本情報
| ライセンス | Apache-2.0 |
| Stars | 372 |
| Forks | 52 |
| カテゴリ | ComfyUI |
| アクティビティ | mid |
最新リリース: 0.4.4 (2026-05-01)
