422 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Real-Time-Voice-Cloning

★ 59.7k ⑂ 9,402 NOASSERTION 更新: 2026-03-09 GitHubで見る →

概要

このリポジトリは、数秒の音声から声の特徴を学習し、任意のテキストをリアルタイムでその声で話すことができるSV2TTS(話者検証からマルチスピーカーテキスト読み上げ合成への転移学習)のオープンソース実装です。

ディープラーニングに基づく3段階のフレームワークで、声のクローン作成と合成を可能にします。

WindowsおよびLinux環境で動作し、NVIDIA GPUまたはCPUを利用してCLIおよびGUIツールボックスとして使用できます。

研究者、開発者、またはリアルタイム音声合成技術に関心のあるユーザーに適していますが、本技術は最新のものではないとされており、より高品質な代替案も提示されています。

互換性・特徴

  • Python
  • CLI
  • GUI
  • GPU対応
  • Windows対応
  • Linux対応

基本情報

ライセンスNOASSERTION
Stars59,730
Forks9,402
カテゴリTTS / 音声
アクティビティmid

最新のissue

GitHub: https://github.com/CorentinJ/Real-Time-Voice-Cloning