概要
Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS(音声合成)モデルです。
ONNX Runtimeベースで動作し、クラウド呼び出しなしで高速に音声生成できます。
従来版から31言語対応へ拡張され、日本語を含む多言語音声合成、短文・長文での読み飛ばしや繰り返しの低減、話者らしさの改善、<laugh>などの簡単な表現タグに対応します。
Python SDKで手早く導入でき、CPUでも扱いやすいため、ローカルアプリ、エッジ環境、軽量な音声生成基盤を求める開発者向けです。
互換性・特徴
- Python
- CLI
- ONNX
- ローカル実行
- CPU対応
- 日本語対応
基本情報
| ライセンス | openrail |
| Likes | 29 |
| Downloads | 530 |
| Pipeline | text-to-speech |
| カテゴリ | TTS / 音声 |
| アクティビティ | low |
HuggingFace: https://huggingface.co/Supertone/supertonic-3
