266 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

CosyVoice-ComfyUI

★ 292 ⑂ 38 Apache-2.0 更新: 2024-09-10 GitHubで見る →

概要

「CosyVoice-ComfyUI」は、最先端の音声生成モデルCosyVoiceの機能をComfyUI上で利用可能にするカスタムノードです。

テキストからの音声合成(TTS)に加えて、SRTファイルを用いた単一または複数音声のクローン作成といった高度な機能を提供します。

ベースTTS、3秒音声クローン、クロスリンガル音声生成、指示ベースの音声生成など、様々なユースケースに対応しており、ComfyUIを普段使いするクリエイターや開発者で、手軽に高品質な音声合成や音声クローンを行いたいユーザーに最適です。

モデルのダウンロードはModelScope経由で行われ、利用にはffmpegのインストールが必要です。

互換性・特徴

  • ComfyUI対応
  • GPU必須
  • Python
  • Web UI
  • 音声合成
  • 音声クローン

基本情報

ライセンスApache-2.0
Stars292
Forks38
カテゴリその他
アクティビティmid

最新のissue

GitHub: https://github.com/AIFSH/CosyVoice-ComfyUI