概要
ComfyUI用のカスタムノードとして、ローカル環境で複数の音声合成エンジンと多言語対応のテキスト読み上げ(TTS)、音声変換、音声編集、RVCモデルトレーニングを統合的に提供するツールです。
F5-TTS、ChatterBox、VibeVoice、Higgs Audio 2、IndexTTS-2、CosyVoice3、Qwen3-TTS、Step Audio EditXなど、多種多様なエンジンに対応し、日本語を含む複数の言語での音声生成が可能です。
無制限のテキスト長、SRTタイミング調整、文字サポートといった豊富なオーディオ機能に加え、字幕の生成・再構築・タイミング推定など、高度な字幕ワークフローもサポートします。
モジュール化されたアーキテクチャにより拡張性も高く、高品質な音声コンテンツ制作を目指すComfyUIユーザーや、複数のTTSエンジンを効率的に活用したいクリエイター、開発者に最適なソリューションです。
互換性・特徴
- ComfyUI対応
- 多言語対応
- 音声合成
- 音声変換
- 音声編集
- SRT対応
基本情報
| ライセンス | NOASSERTION |
| Stars | 973 |
| Forks | 105 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | mid |
最新のissue
- SRT Advanced Options UIがNodes 2.0で壊れている [バグ] (更新: 2026-06-11 / SRT Advanced Options UI is broken in Nodes 2.0 [Bug])
- [バグ] [Higgs] ローカル変数 ‘os’ に値が関連付けられていないためアクセスできません (更新: 2026-06-09 / [Bug] [Higgs] cannot access local variable ‘os’ where it is not associated with a value)
- [バグ] (更新: 2026-06-06 / [Bug])
- [バグ] nopythonモードパイプラインで失敗しました (更新: 2026-06-06 / [Bug] Failed in nopython mode pipeline)
- macOSとflash_attnの問題 (更新: 2026-06-04 / macOS and flash_attn problem)
最新リリース: v4.27.0 – Initial MOSS-TTS LoRA Training Support (2026-05-26)
