ComfyUI向けTTS進化！ChatterBoxがVibeVoice・RVC対応の強力Audio Suiteに

ComfyUI

ComfyUIユーザー待望のニュースです。ChatterBox SRT Voiceが「TTS Audio Suite」として大幅に進化し、VibeVoiceやRVCといった最先端の音声合成技術に対応しました。これにより、より自然で表現豊かなAI音声の生成が可能になります。

2025.09.01

ChatterBoxがTTS Audio Suiteとして新登場

これまで「ChatterBox SRT Voice」として知られていたツールが、「TTS Audio Suite」へと生まれ変わりました。

この進化により、Text-to-Speech（TTS：テキスト音声合成）機能に特化し、ComfyUIの環境でより高度な音声生成を可能にする強力なスイートとして提供されるとのことです。

今回のアップデートの最大の目玉は、その対応技術の幅広さです。TTS Audio Suiteは、VibeVoice、Higgs Audio 2、F5、そしてRVC（Retrieval-based Voice Conversion）といった複数の最先端音声合成技術を統合しています。

これらの技術を組み合わせることで、ユーザーはより表現豊かで、自然な発話、さらには特定の声色を再現する能力を手に入れることができます。ComfyUIの柔軟なワークフローと組み合わせることで、クリエイティブな表現の幅が大きく広がるでしょう。

今回の発表に対し、Redditコミュニティからは早くも期待と感謝の声が寄せられています。

「これはクールだ」「開発の努力に感謝します！」「ビデオウォークスルーが待ち遠しい、ありがとう！」といった好意的なコメントが多く見られ、ComfyUIユーザーの間でこの新機能への関心が高いことがうかがえます。

ChatterBox TTS Audio Suiteの登場は、ComfyUIエコシステムにおける音声生成ワークフローに新たな可能性をもたらします。

AIによるコンテンツ生成が加速する中で、高品質な音声合成の需要は高まる一方です。このツールが、コンテンツクリエイターや開発者の表現活動を強力にサポートしてくれることに期待が高まります。