422 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

GPT-SoVITS

★ 57.4k ⑂ 6,259 MIT 更新: 2026-04-30 GitHubで見る →

概要

GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech(TTS)モデルをトレーニングできる強力なFew-shot音声変換・テキスト読み上げツールです。

5秒の音声サンプルで即座にTTSが可能なゼロショット機能や、日本語を含む多言語での推論に対応しています。

初心者でもデータセット作成やモデル構築ができるよう、WebUIに音声伴奏分離、自動学習セット分割、中国語ASR、テキストラベリングなどのツールが統合されています。

GPUでの高速推論を想定しており、音声変換やテキスト読み上げに関心のある幅広いユーザーがターゲットです。

互換性・特徴

  • Web UI
  • Python
  • GPU必須
  • 日本語対応
  • 多言語対応
  • Docker対応

基本情報

ライセンスMIT
Stars57,398
Forks6,259
カテゴリTTS / 音声
アクティビティhigh

最新のissue

最新リリース: 20250606v2pro (2025-06-06)

GitHub: https://github.com/RVC-Boss/GPT-SoVITS