supertonic-3

概要

Supertonic 3は、端末上で完結するローカル推論向けの軽量TTS（音声合成）モデルです。

ONNX Runtimeベースで動作し、クラウド呼び出しなしで高速に音声生成できます。

従来版から31言語対応へ拡張され、日本語を含む多言語音声合成、短文・長文での読み飛ばしや繰り返しの低減、話者らしさの改善、<laugh>などの簡単な表現タグに対応します。

Python SDKで手早く導入でき、CPUでも扱いやすいため、ローカルアプリ、エッジ環境、軽量な音声生成基盤を求める開発者向けです。

HuggingFace: https://huggingface.co/Supertone/supertonic-3