voice-pro

概要

Voice-Proは、YouTube動画の処理、音声認識、翻訳、テキスト読み上げ、音声クローン、多言語翻訳を統合したAIパワードのWebアプリケーションです。

WhisperやFaster-Whisperによる高精度な音声認識、F5-TTS、E2-TTS、CosyVoiceによるゼロショット音声クローン、Edge-TTSやkokoroによる多言語テキスト読み上げ、YouTube動画のダウンロードと音声抽出、そしてDeep-Translatorによる100以上の言語への即時翻訳機能を提供します。

クリエイター、研究者、多言語を扱うプロフェッショナルが、マルチメディアコンテンツ制作を効率化するための強力なツールです。

互換性・特徴

Web UI
Python
GPU必須
日本語対応
音声認識
音声合成
音声クローン

基本情報

ライセンス	GPL-3.0
Stars	11,132
Forks	1,625
カテゴリ	音声生成 / TTS
アクティビティ	mid

voice-pro

概要

互換性・特徴

基本情報

最新のissue