概要
Voice-Proは、YouTube動画の処理、音声認識、翻訳、テキスト読み上げ、音声クローン、多言語翻訳を統合したAIパワードのWebアプリケーションです。
WhisperやFaster-Whisperによる高精度な音声認識、F5-TTS、E2-TTS、CosyVoiceによるゼロショット音声クローン、Edge-TTSやkokoroによる多言語テキスト読み上げ、YouTube動画のダウンロードと音声抽出、そしてDeep-Translatorによる100以上の言語への即時翻訳機能を提供します。
クリエイター、研究者、多言語を扱うプロフェッショナルが、マルチメディアコンテンツ制作を効率化するための強力なツールです。
互換性・特徴
- Web UI
- Python
- GPU必須
- 日本語対応
- 音声認識
- 音声合成
- 音声クローン
基本情報
| ライセンス | GPL-3.0 |
| Stars | 10,186 |
| Forks | 1,425 |
| カテゴリ | 音声生成 / TTS |
| アクティビティ | mid |
最新のissue
- アラビア語 (更新: 2026-05-24 / arabic)
- CosyVoice TTS向けに有名人の推薦をお願いします (更新: 2026-05-24 / please recommend celebrities for CosyVoice TTS)
- 最新のpip/setuptools環境のLinuxでインストールが失敗する — 4つのバグと修正案 (更新: 2026-05-13 / Installation fails on Linux with modern pip/setuptools — 4 bugs with fixes)
- start.batでエラーが発生します (更新: 2026-05-10 / Getting error for start.bat)
- macOSのサポート予定はありますか? (更新: 2026-05-08 / Any plans to support macos?)
最新リリース: v3.2.0 (2025-12-05)