3,695 repos GH 3,580 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

XTTS-v2

★ 3.6k other 更新: 2023-12-11 HFで見る →

概要

XTTS-v2は、Coquiが開発した高度な音声生成モデルです。

わずか6秒の短い音声クリップを用いることで、既存の声を17種類の異なる言語にクローンできるのが最大の特徴です。

多言語対応、感情やスタイルの転送、クロス言語クローニング、高品質な24kHzサンプリングレートでの音声生成が可能で、大量のトレーニングデータを必要としません。

Coqui StudioやCoqui APIの基盤技術としても活用されており、音声合成や音声クローン技術に関心のある開発者や企業、または手軽に多言語対応の音声コンテンツを作成したいユーザーに適しています。

互換性・特徴

  • Python
  • CLI
  • GPU必須
  • Web UI
  • 日本語対応

基本情報

ライセンスother
Likes3,608
Downloads9,578,491
Pipelinetext-to-speech
カテゴリ音声生成 / TTS
アクティビティmid

HuggingFace: https://huggingface.co/coqui/XTTS-v2