3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ComfyUI-Woosh

★ 108 ⑂ 7 MIT 更新: 2026-05-07 GitHubで見る →

概要

ComfyUI-Wooshは、ComfyUI向けのサウンドエフェクト生成ノード集です。

Sony AIのWoosh基盤モデルを活用し、テキストからオーディオ、またはビデオからオーディオを生成できます。

特に、高速な4ステップ生成を可能にするDFlow/DVFlowといった蒸留モデルが用意されており、効率的な作業が可能です。

ComfyUIのModelPatcherによる動的VRAM管理や、`pip install`不要でWooshライブラリがバンドルされているため、既存のtorch環境を汚染するリスクもありません。

ビデオからのオーディオ生成では、直接ビデオフレームを出力し、他のノードと連携しやすい設計です。

ComfyUIユーザーで、映像作品やプロジェクトにオリジナルのサウンドエフェクトを手軽に追加したいクリエイターや開発者に最適です。

互換性・特徴

  • ComfyUI対応
  • GPU必須
  • Python
  • Text-to-Audio
  • Video-to-Audio
  • サウンドエフェクト生成

基本情報

ライセンスMIT
Stars108
Forks7
カテゴリComfyUI
アクティビティmid

最新リリース: 0.2.7 (2026-05-07)

GitHub: https://github.com/Saganaki22/ComfyUI-Woosh