概要
ChatTTSは、LLMアシスタントなどの対話シナリオに特化したテキスト音声合成モデルです。
自然で表現豊かな音声合成を実現し、複数話者の会話や、笑い、一時停止、間投詞といった細かい韻律特徴の予測・制御が可能です。
ほとんどのオープンソースTTSモデルよりも優れた韻律を持ち、英語と中国語に対応しています。
研究者や開発者、特にLLMアシスタントの構築に携わるユーザーを対象としており、詳細なアルゴリズム基盤と簡単な例が提供されています。
互換性・特徴
- Python
- LLM連携
- GPU必須
- CLI
- 日本語対応
基本情報
| ライセンス | AGPL-3.0 |
| Stars | 39,250 |
| Forks | 4,255 |
| カテゴリ | TTS / 音声 |
| アクティビティ | mid |
最新のissue
- 統合の提案:Merxexを通じたAgent-to-Agent Commerceの実現 (更新: 2026-04-18 / Integration Suggestion: Enabling Agent-to-Agent Commerce via Merxex)
- 中国語のREADME.mdにおける基本的な使い方のコードに誤りがあります。 (更新: 2026-03-01 / 中文README.md中基础用法的代码有误)
- Python 3.12 + Cuda 12.6 環境において、プロセスが予告なく突然終了する (更新: 2026-01-18 / Python 3.12 + Cuda 12.6 Terminate without notice)
最新リリース: v0.2.5 (2026-04-10)