openvoice-cloning

概要

OpenVoiceは、短い参照音声から瞬時に音声をクローニングできるオーディオ基盤モデルです。

ターゲットスピーカーの声質を再現するトーンカラークローニング、感情やアクセント、リズムなどを細かく制御できる音声スタイル制御、そして日本語を含む多言語での音声生成とクロスリンガルクローニングが可能です。

特にOpenVoice V2ではオーディオ品質が向上し、日本語、英語、中国語など6言語にネイティブ対応しています。

研究者や開発者が、高品質な音声クローニングや多言語音声合成を必要とする場合に最適なツールで、商用利用も可能です。

GitHub: https://github.com/Seizenyaculvert/openvoice-cloning