概要
TTS WebUIは、GradioとReactを基盤とする統合型Webユーザーインターフェースで、様々なテキスト読み上げ(TTS)、音声/音楽生成、音声変換モデルを一元的に管理・利用できます。
ACE-Step、OmniVoice、GPT-SoVITS、XTTSv2、Bark、MusicGen、RVCなど、多岐にわたる先進的なAIモデルを拡張機能としてサポートしており、これらの技術を簡単に試したい開発者、クリエイター、研究者など、広範な音声AI技術に関心のあるユーザーを想定しています。
直感的な操作で高度な音声処理が可能な点が特徴です。
互換性・特徴
- Web UI
- Python
- Gradio
- React
- Docker対応
- GPU必須
基本情報
| ライセンス | MIT |
| Stars | 3,129 |
| Forks | 319 |
| カテゴリ | 音楽・音声生成 |
| アクティビティ | high |
最新のissue
- (uv) 拡張機能のiframeが127.0.0.1:7769にハードコードされているため、リモート/クラウドデプロイが機能しない (更新: 2026-05-05 / (uv) extension iframes hardcoded to 127.0.0.1:7769 — breaks all remote/cloud deployments)
- huggingface_hub >= 1.0でHuggingface Cache Manager拡張機能が破損(’huggingface_hub.commands’モジュールが見つからない) (更新: 2026-05-05 / Huggingface Cache Manager extension broken with huggingface_hub >= 1.0 (No module named ‘huggingface_hub.commands’))
- Linux上でこのプログラムにおける多数のTTSオプションの試用 (更新: 2026-04-30 / A trial of many TTS options in this program, on Linux)
- インストール時にlibdcudart.so.12が見つからない (更新: 2026-04-14 / libdcudart.so.12 missing on install)
最新リリース: Release 1.5.1 (2026-05-14)
