概要
UTMOS-PyTorchは、音声品質評価モデルUTMOSの非公式なPyTorch実装です。
オリジナルのUTMOSが依存するfairseqのインストールが困難な現代のPython環境でも、容易に利用できるように設計されています。
特に、ニューラルオーディオコーデックやテキスト音声合成(TTS)の研究者や開発者が、複雑なセットアップなしでUTMOSによる音声品質予測を行えるようにすることを目的としています。
オリジナル版とのスコア一致が検証されており、TorchScript版も提供されるため、PyTorchのみでの利用も可能です。
このツールは、最新の研究環境において効率的な音声品質評価を可能にします。
互換性・特徴
- Python
- PyTorch
- CLI
- GPU対応
- Hugging Face Hub
基本情報
| ライセンス | MIT |
| Stars | 18 |
| Forks | 1 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | low |
