3,640 repos GH 3,525 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

GPT-SoVITS

★ 59.1k ⑂ 6,447 MIT 更新: 2026-06-20 GitHubで見る →

概要

GPT-SoVITS-WebUIは、最小1分の音声データから高品質なText-to-Speech(TTS)モデルをトレーニングできる強力なFew-shot音声変換・テキスト読み上げツールです。

5秒の音声サンプルで即座にTTSが可能なゼロショット機能や、日本語を含む多言語での推論に対応しています。

初心者でもデータセット作成やモデル構築ができるよう、WebUIに音声伴奏分離、自動学習セット分割、中国語ASR、テキストラベリングなどのツールが統合されています。

GPUでの高速推論を想定しており、音声変換やテキスト読み上げに関心のある幅広いユーザーがターゲットです。

互換性・特徴

  • Web UI
  • Python
  • GPU必須
  • 日本語対応
  • 多言語対応
  • Docker対応

基本情報

ライセンスMIT
Stars59,116
Forks6,447
カテゴリ音声生成 / TTS
アクティビティhigh

最新のissue

最新リリース: 20250606v2pro (2025-06-06)

GitHub: https://github.com/RVC-Boss/GPT-SoVITS