3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ComfyUI-VibeVoice

★ 586 ⑂ 108 MIT 更新: 2025-09-25 GitHubで見る →

概要

ComfyUI-VibeVoiceは、MicrosoftのVibeVoiceをComfyUIに統合するカスタムノードです。

表現力豊かで長尺なマルチスピーカー会話音声を生成できる最先端のツールであり、最大4人の異なる話者によるダイアログやポッドキャストの作成に最適です。

既存の音声ファイルから高忠実度なボイスクローンを作成したり、ゼロショット生成と組み合わせたりすることが可能で、高度なアテンションメカニズムや4ビット量子化によるVRAM削減機能も備えています。

ComfyUIユーザーが、高品質かつ自然な会話音声を効率的に生成することを想定しています。

互換性・特徴

  • ComfyUI対応
  • GPU必須
  • Python
  • 音声合成 (TTS)
  • ボイスクローン
  • マルチスピーカー

基本情報

ライセンスMIT
Stars586
Forks108
カテゴリComfyUI
アクティビティmid

最新のissue

最新リリース: v1.5.1 – Maintenance release (2025-09-25)

GitHub: https://github.com/wildminder/ComfyUI-VibeVoice