概要
Chatterbox TTS Serverは、オープンソースのChatterbox TTSモデル(オリジナル、多言語、高速なTurbo版)をセルフホストし、ユーザーフレンドリーなWeb UIとOpenAI互換APIを通じて提供する音声合成ツールです。
主な特徴として、23言語対応、`[laugh]`などの感情タグを含む表現力豊かな音声生成、音声クローニング、インテリジェントな分割による大規模なテキスト処理、オーディオブック生成機能があります。
NVIDIA (CUDA)、AMD (ROCm)、Apple Silicon (MPS) GPUで高速動作し、CPUフォールバックも可能です。
開発者や企業が音声合成モデルを自社環境で運用し、カスタム音声エージェントやナレーション、オーディオブックを効率的に作成したい場合に最適です。
互換性・特徴
- Web UI
- OpenAI互換API
- 音声クローニング
- 多言語対応
- GPU対応
- Python
基本情報
| ライセンス | MIT |
| Stars | 1,287 |
| Forks | 309 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | high |
最新のissue
- Streaming Support for OpenAI Endpoint (更新: 2026-06-08)
- 任意のモデルのサポートを追加することは可能ですか? (更新: 2026-06-01 / Is it possible to add support for arbitrary models?)
- Dockerビルドの際に、URLの名前解決ができない問題について (更新: 2026-05-27 / Unable to resolve URLs when trying to build docker)
- Apple Silicon環境でのインストール手順が機能しない (更新: 2026-05-20 / Apple Silicon instructions are broken)
最新リリース: v2.0.0 – Complete Chatterbox Family: Multilingual + Turbo + Portable Mode + Multi-GPU (2026-05-11)
