概要
Supertone/supertonic-3モデル向けに、音声スタイル(.jsonファイル)を学習させるためのツールです。
低GPU使用量(ピーク時約2.6GB)と高速な学習(通常6〜30分)が特徴で、シングルスピーカーのクローン作成やスタイル抽出に柔軟に対応します。
アクセントや複雑な韻律の学習にも利用でき、研究者や音声合成開発者が多様な音声スタイルを効率的に生成・学習するために想定されています。
互換性・特徴
- Colab対応
- GPU必須
- Python
- 音声合成
- AI/ML
基本情報
| ライセンス | MIT |
| Stars | 3 |
| Forks | 1 |
| カテゴリ | TTS / 音声 |
| アクティビティ | low |
GitHub: https://github.com/saurabhv749/supertonic3-voice-clone