1,937 repos GH 1,822 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

voice-pro

★ 10.2k ⑂ 1,425 GPL-3.0 更新: 2025-12-05 GitHubで見る →

概要

Voice-Proは、YouTube動画の処理、音声認識、翻訳、テキスト読み上げ、音声クローン、多言語翻訳を統合したAIパワードのWebアプリケーションです。

WhisperやFaster-Whisperによる高精度な音声認識、F5-TTS、E2-TTS、CosyVoiceによるゼロショット音声クローン、Edge-TTSやkokoroによる多言語テキスト読み上げ、YouTube動画のダウンロードと音声抽出、そしてDeep-Translatorによる100以上の言語への即時翻訳機能を提供します。

クリエイター、研究者、多言語を扱うプロフェッショナルが、マルチメディアコンテンツ制作を効率化するための強力なツールです。

互換性・特徴

  • Web UI
  • Python
  • GPU必須
  • 日本語対応
  • 音声認識
  • 音声合成
  • 音声クローン

基本情報

ライセンスGPL-3.0
Stars10,186
Forks1,425
カテゴリ音声生成 / TTS
アクティビティmid

最新のissue

最新リリース: v3.2.0 (2025-12-05)

GitHub: https://github.com/abus-aikorea/voice-pro