概要
Bert-VITS2は、多言語BERTをVITS2バックボーンに統合したテキスト読み上げ(TTS)システムです。
このツールは、高度な音声合成技術を提供し、多様な言語での高品質な音声生成を目指しています。
デモ動画も公開されていますが、短期的なメンテナンスは終了しており、開発元はより進化した後継プロジェクト「Fish-Speech」の利用を推奨しています。
主にコードを読み解き、トレーニングプロセスを自ら進められる上級者や研究者を対象としています。
使用にあたっては、中国の関連法規を遵守する必要があります。
互換性・特徴
- Python
- 多言語対応
- Web UI
- TTS
- GPU推奨
基本情報
| ライセンス | AGPL-3.0 |
| Stars | 8,759 |
| Forks | 1,288 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | high |
最新リリース: Extra:Japanese Specialized Version (2024-02-01)
