3,134 repos GH 3,019 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Confucius4-TTS

★ 142 ⑂ 13 NOASSERTION 更新: 2026-06-06 GitHubで見る →

概要

Confucius4-TTSは、LLMと音声エンコーダをベースにした、多言語・異言語対応のゼロショット音声合成エンジンです。

「One voice. Any language.」をコンセプトに、たった一つの声から14の異なる言語で高品質な音声を生成できます。

参照音声のみで追加学習なしに話者の声をクローンし、その声で別言語を話させたり、感情を転送したりする機能が特徴です。

多言語環境で一貫した話者による音声コンテンツを作成したい開発者や研究者に特に適しています。

CLIまたはPython APIを通じて利用可能で、オンラインデモも提供されています。

互換性・特徴

  • Python
  • CLI
  • Web UI
  • GPU必須
  • Hugging Face対応
  • 音声合成

基本情報

ライセンスNOASSERTION
Stars142
Forks13
カテゴリ音声生成 / TTS
アクティビティmid

最新のissue

GitHub: https://github.com/netease-youdao/Confucius4-TTS