1,738 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

CosyVoice

★ 21.0k ⑂ 2,421 Apache-2.0 更新: 2026-05-03 GitHubで見る →

概要

FunAudioLLMが開発するCosyVoiceは、大規模言語モデル(LLM)を基盤とした多言語対応の音声生成モデルです。

最新版のFun-CosyVoice 3.0は、9言語(日本語を含む)と多数の中国方言でのゼロショット音声合成を可能にし、コンテンツの一貫性、話者類似性、イントネーションの自然さにおいて高い性能を誇ります。

発音の細かな調整や、数字・記号の直接読み上げ、低遅延でのリアルタイムストリーミングも特徴です。

研究者、開発者、コンテンツクリエイターが、高品質な多言語音声コンテンツを効率的に生成・利用することを想定しています。

互換性・特徴

  • 日本語対応
  • Python
  • LLMベース
  • API
  • 音声合成
  • ゼロショット音声クローン

基本情報

ライセンスApache-2.0
Stars21,023
Forks2,421
カテゴリTTS / 音声
アクティビティhigh

最新のissue

GitHub: https://github.com/FunAudioLLM/CosyVoice