概要
「CosyVoice-ComfyUI」は、最先端の音声生成モデルCosyVoiceの機能をComfyUI上で利用可能にするカスタムノードです。
テキストからの音声合成(TTS)に加えて、SRTファイルを用いた単一または複数音声のクローン作成といった高度な機能を提供します。
ベースTTS、3秒音声クローン、クロスリンガル音声生成、指示ベースの音声生成など、様々なユースケースに対応しており、ComfyUIを普段使いするクリエイターや開発者で、手軽に高品質な音声合成や音声クローンを行いたいユーザーに最適です。
モデルのダウンロードはModelScope経由で行われ、利用にはffmpegのインストールが必要です。
互換性・特徴
- ComfyUI対応
- GPU必須
- Python
- Web UI
- 音声合成
- 音声クローン
基本情報
| ライセンス | Apache-2.0 |
| Stars | 292 |
| Forks | 38 |
| カテゴリ | その他 |
| アクティビティ | mid |
最新のissue
- whisper.tokenizer.get_tokenizerというエンティティが存在しません (更新: 2025-10-15 / There is no such entity as whisper.tokenizer.get_tokenizer)
- [プログラムクラッシュ、終了コード3221226505 (0xC0000409)] (更新: 2025-09-12 / [程序崩溃,退出代码为 3221226505 (0xC0000409)])
- 中国語のクローン生成時に広東語が混入、調整方法は? (更新: 2025-06-08 / 克隆生成中文语言时会混入粤语,要怎么调整?When cloning and generating the Chinese language, Cantonese will be mixed in. How should it be adjusted?)
- ComfyUI公式デスクトップ版のインストールができません (更新: 2025-03-28 / ComfyUI官方桌面版无法安装)
- [ONNXRuntimeError] : 6 : RUNTIME_EXCEPTION (更新: 2025-03-27)