概要
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。
ONNX Runtimeベースで動作し、クラウド呼び出しなしで高速に音声生成できます。
従来版から31言語対応へ拡張され、日本語を含む多言語音声合成、短文・長文での読み飛ばしや繰り返しの低減、話者らしさの改善、<laugh>などの簡単な表現タグに対応します。
Python SDKで手早く導入でき、CPUでも扱いやすいため、ローカルアプリ、エッジ環境、軽量な音声生成基盤を求める開発者向けです。
互換性・特徴
- Python
- CLI
- ONNX
- ローカル実行
- CPU対応
- 日本語対応
基本情報
| ライセンス | openrail |
| Likes | 854 |
| Downloads | 51,213 |
| Pipeline | text-to-speech |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | mid |
HuggingFace: https://huggingface.co/Supertone/supertonic-3
