MisoTTS-ComfyUI

概要

MisoTTS-ComfyUIは、ComfyUI向けのテキスト読み上げ（TTS）ノードです。

Miso TTS 8BモデルとMimiオーディオトークンを使用し、セサミスタイルのCSMテキスト音声合成を提供します。

オプションで参照オーディオを用いた音声継続生成、Whisperによる音声認識、ComfyUIのAUDIO配線、およびAimdo/VRAM管理機能との統合が可能です。

BF16対応、ローカルアセット保存、自動dtype判別、効率的なVRAM管理などの特徴を持ちます。

ComfyUIユーザーで、高品質なテキスト音声変換、音声からのテキスト書き起こし、または特定の音声スタイルを継続した音声生成を行いたい開発者やクリエイターに最適です。

GitHub: https://github.com/Saganaki22/MisoTTS-ComfyUI