概要
本ツールは、WavLM表現から高品質なフランス語音声を再構築するニューラルボコーダーです。
JEP 2026に採択された論文の公式実装であり、連続的な音声変換の基礎技術として開発されました。
WavLM-Base+との統合、HiFi-GANジェネレーター、学習済みレイヤー融合、敵対的学習を特徴とし、フランス語の音声変換や音声合成の研究者・開発者にとって有用です。
デモも提供されており、容易に試すことができます。
互換性・特徴
- Python
- PyTorch
- CLI
- GPU必須
- フランス語対応
- Hugging Face
基本情報
| ライセンス | MIT |
| Stars | 30 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |