7 repos · 4 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

ComfyUI-Woosh

★ 90 ⑂ 6 MIT 更新: 2026-05-03 GitHubで見る →

概要

「ComfyUI-Woosh」は、Sony AIの先進的なWoosh基盤モデルを活用し、テキストからサウンドエフェクト、さらには動画からオーディオを生成するComfyUI向けのカスタムノードです。

このツールは、テキスト入力から高品質なオーディオを生成する「Text-to-Audio」機能と、動画フレームから音を抽出・生成する「Video-to-Audio」機能を搭載。

DFlowやDVFlowといった蒸留モデルにより、わずか4ステップでの高速生成が可能です。

また、ComfyUIのModelPatcherを活用したGPU-CPU間の動的VRAMオフロード機能や、強制オフロードオプションにより、VRAM容量が限られた環境でも効率的に動作します。

`pip install`不要で、既存のPython環境に影響を与えず導入できるため、ComfyUIでAIを活用したサウンドデザインを手軽に始めたいクリエイターや開発者に最適です。

互換性・特徴

  • ComfyUI対応
  • GPU必須
  • Python
  • テキスト・ツー・オーディオ
  • 動画・ツー・オーディオ

基本情報

ライセンスMIT
Stars90
Forks6
カテゴリComfyUI / カスタムノード
アクティビティlow

最新のissue

最新リリース: 0.2.6 (2026-05-03)

GitHub: https://github.com/Saganaki22/ComfyUI-Woosh