3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

VibeVoice-ComfyUI

★ 1.5k ⑂ 241 MIT 更新: 2026-02-18 GitHubで見る →

概要

VibeVoice ComfyUI Nodesは、MicrosoftのVibeVoiceテキスト読み上げモデルをComfyUIに統合するツールです。

これにより、ComfyUIのワークフロー内で高品質な単一話者および複数話者(最大4人)の音声合成を直接実行できます。

音声クローニング、LoRAサポートによるボイスの微調整、音声速度制御、テキストファイルからのスクリプト読み込み、自動テキストチャンク処理、カスタム一時停止タグなど、豊富な機能を備えています。

パフォーマンス最適化として、各種アテンションメカニズムの選択、拡散ステップの調整、VRAM管理機能、Apple Silicon (MPS) のサポート、8ビット/4ビット量子化によるVRAM削減も可能です。

ComfyUIユーザーで、VibeVoiceモデルを使った高度な音声合成を求めるクリエイターや開発者に適しています。

互換性・特徴

  • ComfyUI対応
  • 音声合成
  • GPU対応
  • Apple Silicon対応
  • クロスプラットフォーム
  • Python

基本情報

ライセンスMIT
Stars1,502
Forks241
カテゴリComfyUI
アクティビティmid

最新のissue

最新リリース: v1.8.1 – Critical Bitsandbytes Fix (2025-10-02)

GitHub: https://github.com/Enemyx-net/VibeVoice-ComfyUI