ComfyUI-Woosh

概要

ComfyUI-Wooshは、ComfyUI向けのサウンドエフェクト生成ノード集です。

Sony AIのWoosh基盤モデルを活用し、テキストからオーディオ、またはビデオからオーディオを生成できます。

特に、高速な4ステップ生成を可能にするDFlow/DVFlowといった蒸留モデルが用意されており、効率的な作業が可能です。

ComfyUIのModelPatcherによる動的VRAM管理や、`pip install`不要でWooshライブラリがバンドルされているため、既存のtorch環境を汚染するリスクもありません。

ビデオからのオーディオ生成では、直接ビデオフレームを出力し、他のノードと連携しやすい設計です。

ComfyUIユーザーで、映像作品やプロジェクトにオリジナルのサウンドエフェクトを手軽に追加したいクリエイターや開発者に最適です。

最新リリース: 0.2.7 (2026-05-07)

GitHub: https://github.com/Saganaki22/ComfyUI-Woosh