3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

VibeVoice-ComfyUI

★ 1.5k ⑂ 241 MIT 更新: 2026-02-18 GitHubで見る →

#Apple Silicon対応 #ComfyUI対応 #GPU対応 #Python #クロスプラットフォーム #音声合成

概要

VibeVoice ComfyUI Nodesは、MicrosoftのVibeVoiceテキスト読み上げモデルをComfyUIに統合するツールです。

これにより、ComfyUIのワークフロー内で高品質な単一話者および複数話者（最大4人）の音声合成を直接実行できます。

音声クローニング、LoRAサポートによるボイスの微調整、音声速度制御、テキストファイルからのスクリプト読み込み、自動テキストチャンク処理、カスタム一時停止タグなど、豊富な機能を備えています。

パフォーマンス最適化として、各種アテンションメカニズムの選択、拡散ステップの調整、VRAM管理機能、Apple Silicon (MPS) のサポート、8ビット/4ビット量子化によるVRAM削減も可能です。

ComfyUIユーザーで、VibeVoiceモデルを使った高度な音声合成を求めるクリエイターや開発者に適しています。

互換性・特徴

ComfyUI対応
音声合成
GPU対応
Apple Silicon対応
クロスプラットフォーム
Python

基本情報

ライセンス	MIT
Stars	1,502
Forks	241
カテゴリ	ComfyUI
アクティビティ	mid

最新のissue

VibeVoiceシングルスピーカーノードにモデルが表示されない (更新: 2026-05-19 / Model not listed in VibeVoice single speaker node)
新規Comfyuiポータブルインストールでのエラー: VibeVoiceモデルロード失敗、’VibeVoiceAcousticTokenizerConfig’は既に使用済み。 (更新: 2026-05-19 / Error in new Comfyui portable installation "Failed to load VibeVoice model: ‘<class ‘modular.configuration_vibevoice.VibeVoiceAcousticTokenizerConfig’>’ is already used by a Transformers model.")
Speech-To-Speech機能の提供について検討中ですか？ (更新: 2026-04-07 / Speech-To-Speech?)
ノードがトークナイザーのインターネット接続を強制 (2つの回避策あり)。 (更新: 2026-04-04 / The node forces internet call for tokenizer (2 work-arounds))

最新リリース: v1.8.1 – Critical Bitsandbytes Fix (2025-10-02)

GitHub: https://github.com/Enemyx-net/VibeVoice-ComfyUI

← 全リポジトリ一覧へ