概要
MARS5は、CAMB.AIが開発した英語の音声合成(TTS)モデルです。
わずか5秒の音声とテキストスニペットから、スポーツ解説やアニメのようなプロソディが難しいシナリオでも高品質な音声を生成できます。
句読点や大文字小文字で音声のニュアンスを調整できる点が特徴です。
Pythonのtorch.hubを通じて簡単に利用でき、研究者や開発者が、表現力豊かな音声合成を必要とするアプリケーション開発に活用することを想定しています。
互換性・特徴
- Python
- TTS
- Colab
- HuggingFace
- 深層学習
基本情報
| ライセンス | AGPL-3.0 |
| Stars | 2,810 |
| Forks | 244 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | mid |
最新のissue
- サンプルリンクが機能しません (更新: 2026-02-10 / Samples link ain’t working)
- MARS5-TTSサンプルノートブックが推論に失敗 (ValueError: Unable to avoid copy while creating an array as requested) (更新: 2025-11-15 / MARS5-TTS sample notebook fails to inference (ValueError: Unable to avoid copy while creating an array as requested))
- 暗い夜 (更新: 2025-08-22 / тёмная ночь)
- 機能リクエスト: ロシア語とスペイン語のサポート (更新: 2025-07-06 / Feature Request: Russian and Spanish Language Support)
- キーワード引数 ‘cfg’ がありません (更新: 2025-01-07 / No keyword argument ‘cfg’)
最新リリース: New AR checkpoint (2024-07-05)
