概要
Chatterboxは、Resemble AIが開発したオープンソースの高品質なテキスト読み上げ(TTS)モデルです。
23言語に対応した多言語版も提供されており、特に感情の誇張度を制御できる独自の機能が特徴で、ElevenLabsのような商用システムに匹敵する、またはそれ以上の性能を発揮します。
ミーム、ビデオ、ゲーム、AIエージェントなど、表現力豊かな音声が必要なコンテンツクリエーターや開発者を想定ユーザーとしており、責任あるAI利用のためにウォーターマーク機能も内蔵しています。
互換性・特徴
- Python
- GPU必須
- 多言語対応
- 日本語対応
- Text-to-Speech
- Web UI
基本情報
| ライセンス | mit |
| Likes | 1,576 |
| Downloads | 2,235,498 |
| Pipeline | text-to-speech |
| カテゴリ | TTS / 音声 |
| アクティビティ | high |
HuggingFace: https://huggingface.co/ResembleAI/chatterbox
