ComfyUI-StableAudioX

概要

ComfyUI上でAudioXモデルを使い、テキストや動画を入力として高品質な音声・音楽を生成できる拡張機能です。

テキストからの効果音生成、音楽制作、動画内容に合わせた音声生成に対応し、ネガティブプロンプト、CFG調整、音量正規化、動画のミュートや音声合成など実用機能も備えます。

ComfyUIで音声生成ワークフローを組みたいクリエイター、映像制作者、実験的な音響制作を行う開発者向けです。

ノードの色をハードコードしないでください (更新: 2026-03-11 / 请不要对节点配色进行硬编码)
CLIP visual encoderとT5モデルの読み込みは、手動ダウンロードしてローカルで直接実行できますか？ (更新: 2026-03-11 / CLIP visual encoder and Loading T5 model能改成手动下载在本地直接加载运行吗?)
これを更新できますか？ (更新: 2026-02-14 / Can you update this?)
AudioXモデルのロードに失敗しました: ‘decord’モジュールが見つかりません (更新: 2026-01-05 / Failed to load AudioX model: Failed to load AudioX model from file: No module named ‘decord’)
CUDAにインストールされているtorchを上書きしています (更新: 2025-12-05 / You are overwriting CUDA installed torch)

GitHub: https://github.com/lum3on/ComfyUI-StableAudioX