概要
「ComfyUI-Woosh」は、Sony AIの先進的なWoosh基盤モデルを活用し、テキストからサウンドエフェクト、さらには動画からオーディオを生成するComfyUI向けのカスタムノードです。
このツールは、テキスト入力から高品質なオーディオを生成する「Text-to-Audio」機能と、動画フレームから音を抽出・生成する「Video-to-Audio」機能を搭載。
DFlowやDVFlowといった蒸留モデルにより、わずか4ステップでの高速生成が可能です。
また、ComfyUIのModelPatcherを活用したGPU-CPU間の動的VRAMオフロード機能や、強制オフロードオプションにより、VRAM容量が限られた環境でも効率的に動作します。
`pip install`不要で、既存のPython環境に影響を与えず導入できるため、ComfyUIでAIを活用したサウンドデザインを手軽に始めたいクリエイターや開発者に最適です。
互換性・特徴
- ComfyUI対応
- GPU必須
- Python
- テキスト・ツー・オーディオ
- 動画・ツー・オーディオ
基本情報
| ライセンス | MIT |
| Stars | 90 |
| Forks | 6 |
| カテゴリ | ComfyUI / カスタムノード |
| アクティビティ | low |
最新のissue
- バージョン2.6へのアップグレードが依然として失敗する (更新: 2026-05-06 / version 2.6 upgrade still broken)
- 背景にノイズが入ります (更新: 2026-05-06 / I am getting background noise)
最新リリース: 0.2.6 (2026-05-03)