概要
WavTTS-ComfyUIは、人気のある画像生成UI「ComfyUI」に統合されたWavTTSモデルのノードセットです。
参照音声とテキスト入力からゼロショットで自然な音声を生成するテキスト読み上げ機能を提供し、既存の音声スタイルを保持した合成が可能です。
オプションでWhisperによる参照音声の自動文字起こし機能も備えています。
ComfyUIのAUDIO入出力に対応しており、VRAM管理に配慮した設計と安全な依存関係インストーラーにより、ComfyUI環境へのスムーズな導入を目指しています。
主にComfyUIを使ってAI音声合成を行いたいクリエイターや開発者、特に参照音声に基づいた細やかな音声表現を求めるユーザーに適しています。
互換性・特徴
- ComfyUI対応
- TTS
- ゼロショット学習
- Python
- GPU必須
- オーディオ処理
基本情報
| ライセンス | MIT |
| Stars | 3 |
| カテゴリ | ComfyUI |
| アクティビティ | low |
