概要
ComfyUI上でAudioXモデルを使い、テキストや動画を入力として高品質な音声・音楽を生成できる拡張機能です。
テキストからの効果音生成、音楽制作、動画内容に合わせた音声生成に対応し、ネガティブプロンプト、CFG調整、音量正規化、動画のミュートや音声合成など実用機能も備えます。
ComfyUIで音声生成ワークフローを組みたいクリエイター、映像制作者、実験的な音響制作を行う開発者向けです。
互換性・特徴
- ComfyUI対応
- GPU推奨
- Python
- Web UI
- 動画入力対応
- 音声生成
基本情報
| ライセンス | NOASSERTION |
| Stars | 52 |
| Forks | 9 |
| カテゴリ | ComfyUI |
| アクティビティ | low |
最新のissue
- ノードの配色をハードコードしないでください (更新: 2026-03-11 / 请不要对节点配色进行硬编码)
- CLIP visual encoder と Loading T5 model を手動ダウンロードしてローカルから直接読み込んで実行できますか? (更新: 2026-03-11 / CLIP visual encoder and Loading T5 model能改成手动下载在本地直接加载运行吗?)
- これを更新してもらえますか? (更新: 2026-02-14 / Can you update this?)
- AudioX model の読み込みに失敗: ファイルから AudioX model を読み込めませんでした: No module named ‘decord’ (更新: 2026-01-05 / Failed to load AudioX model: Failed to load AudioX model from file: No module named ‘decord’)
- インストール済みの CUDA 対応 torch を上書きしています (更新: 2025-12-05 / You are overwriting CUDA installed torch)