3,616 repos GH 3,501 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

音声生成 / TTS

CosyVoice

★ 22.0k ⑂ 2,532 Apache-2.0 更新: 2026-05-25 GitHubで見る →

#API #LLMベース #Python #ゼロショット音声クローン #日本語対応 #音声合成

概要

FunAudioLLMが開発するCosyVoiceは、大規模言語モデル（LLM）を基盤とした多言語対応の音声生成モデルです。

最新版のFun-CosyVoice 3.0は、9言語（日本語を含む）と多数の中国方言でのゼロショット音声合成を可能にし、コンテンツの一貫性、話者類似性、イントネーションの自然さにおいて高い性能を誇ります。

発音の細かな調整や、数字・記号の直接読み上げ、低遅延でのリアルタイムストリーミングも特徴です。

研究者、開発者、コンテンツクリエイターが、高品質な多言語音声コンテンツを効率的に生成・利用することを想定しています。

互換性・特徴

日本語対応
Python
LLMベース
API
音声合成
ゼロショット音声クローン

基本情報

ライセンス	Apache-2.0
Stars	21,992
Forks	2,532
カテゴリ	音声生成 / TTS
アクティビティ	mid

最新のissue

Turkish Language Support Issue (更新: 2026-07-06)
请问，大家都是使用什么方式部署cosyvoice3，vllm还是triton_trtllm (更新: 2026-07-05)
CosyVoice 2.0 exhibits audio stuttering during zero-shot streaming inference (更新: 2026-07-04)
生成的音频是胡言乱语 (更新: 2026-07-04)

GitHub: https://github.com/FunAudioLLM/CosyVoice

← 全リポジトリ一覧へ