概要
OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。
ターゲットスピーカーの声質を再現するトーンカラークローニング、感情やアクセント、リズムなどを細かく制御できる音声スタイル制御、そして日本語を含む多言語での音声生成とクロスリンガルクローニングが可能です。
特にOpenVoice V2ではオーディオ品質が向上し、日本語、英語、中国語など6言語にネイティブ対応しています。
研究者や開発者が、高品質な音声クローニングや多言語音声合成を必要とする場合に最適なツールで、商用利用も可能です。
互換性・特徴
- 音声合成
- 音声クローニング
- 多言語対応
- 日本語対応
- AI/ML
- Python
基本情報
| ライセンス | MIT |
| Stars | 5 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
GitHub: https://github.com/Seizenyaculvert/openvoice-cloning
