概要
「Voice Cloning App」は、PythonとPyTorchを利用して人間の音声を簡単に合成できるアプリケーションです。
自動データセット生成(字幕やオーディオブック対応)、多言語サポート、ローカルおよびリモートでのトレーニング、簡単なトレーニング開始/停止、データインポート/エクスポート、マルチGPUサポートといった主要な機能を備えています。
Windows 10またはUbuntu 20.04以上、5GB以上のディスク容量を必要とし、NVIDIA GPU(4GB以上のメモリ)を推奨しています。
想定ユーザーは、自分の声を複製したい、または多様な音声データから新しい音声を生成したい開発者や研究者です。
互換性・特徴
- Python
- PyTorch
- GPU必須
- Windows対応
- Ubuntu対応
- 音声合成
基本情報
| ライセンス | BSD-3-Clause |
| Stars | 1,438 |
| Forks | 239 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | mid |
最新のissue
- 言語サポート (更新: 2024-12-01 / languages support)
- わかりません 😉 (更新: 2024-12-01 / i dont know ;))
- バグ: ディレクトリのみをイテレートする (更新: 2024-12-01 / bug: Only iterate over directories)
- 自分の声をローカルでクローンする方法 (更新: 2023-09-15 / How to clone my own voice locally)
最新リリース: Version 1.1.1 (2022-02-07)
GitHub: https://github.com/voice-cloning-app/Voice-Cloning-App
