概要
このツールは、Apple Siliconデバイス上で動作するIndexTTS2向けの、美しく機能的なWebUIです。
FastAPIをバックエンドに採用し、ダークテーマ、8種類の感情を細かく制御できる機能、カスタム参照オーディオ(.wav、.mp3、.m4a、.npz)のアップロード、そして生成した音声をワンクリックでNPZスピーカーとしてエクスポートする機能を提供します。
モデルはオンデマンドでロード・アンロードされるため、他のMLXワークロードのためにメモリを効率的に使用できます。
主にApple Siliconユーザーで、IndexTTS2を使った音声合成において、感情表現や詳細なパラメーター調整をWebUI経由で手軽に行いたい開発者やクリエイターを想定しています。
互換性・特徴
- Apple Silicon対応
- Web UI
- Python
- FastAPI
- GPU必須
基本情報
| ライセンス | NOASSERTION |
| Stars | 1 |
| カテゴリ | TTS / 音声 |
| アクティビティ | low |
