
ACE-Step 1.5 XLの公開を受けて、Redditでは「ComfyUIですぐ使えるのか」「前版より本当に良くなったのか」をめぐって反応が割れている。
ACE-Step 1.5 XLの概要
今回話題になったのは、ACE-Step 1.5 XLの公開とHugging Face上の説明である。
コメント欄では、導入直後の動作報告だけでなく、cover対応の実態や音質面の進歩にも話題が広がっていた。
ACE-Step 1.5 XLをめぐる実際のやり取り
ComfyUIで今すぐ動くのか
でもまだComfyでは動かない。ノードを更新しないといけない気がする。
nightlyなら動くはずだ。
自分の環境ではモデルの読み込みに失敗する。ComfyUIのnightlyが必要なのかもしれない。
新しいインストールでnightlyに切り替えていなかっただけだった。nightlyでは動いた。
公開直後ということもあり、まずは動く環境と動かない環境の報告が先に集まっている。
cover対応の説明をそのまま信じていいのか
coverとrepaintもできるらしい。
本当にcoverができるなら最高だが、自分にはまだそう見えない。どこで確認したんだ。
Hugging Faceの説明では、XL版はtext-to-music、cover、repaint、extractなどを支える基盤モデルだと書かれている。
前の版もcover対応と書いてあったが、実際はそこまででもなかった。自分の環境で動くようになってから試したい。
仕様表の文言だけでは信用しきれず、実際に触って確かめたいという反応が目立つ。
前版より良くなったのか、音質はどうなのか
ここ数か月追えていなかった。前のリリースはどの程度だったのか、XLに何を期待すればいいのか、短く知りたい。
前の版はまあまあだった。XLは目に見えて良くなっているし、GitHubのリンク先にあるオンライン生成も試せる。
1.5公開時に試したが、実用的なものはほとんど作れなかった。今回ははっきり良くなっていてほしい。
ACE-StepでSunoっぽい曲が出ることはあるし、一部では上回ることもある。ただかなり稀で、ワークフロー以外の工夫も必要だった。自分のテストでは、プロンプトの癖、金属っぽい音、歌詞の弱さ、3分制限などが気になった。
品質面の違和感は学習データ由来かもしれない。実際、できあがる曲にはロイヤリティフリー音源っぽさが強く出ることがあった。
ここでは評価がかなり割れており、XLで改善したという声と、前版から続く不満を引きずっている声が同時に並んでいる。
使い方の難しさも壁になっている
すごい。ただ、どう使えばいいのかまだ分からない。shardの統合やfp16化を誰かがやってくれるのを待ったほうが早いのかもしれない。そもそもComfyUIが対応しているのかも気になる。
StarNodes拡張を使えば自分でもできるし、XLは従来のワークフローでも動く。
モデルそのものの評価だけでなく、導入手順の分かりにくさもハードルとして語られていた。
見解まとめ
ACE-Step 1.5 XLには期待が集まっている一方で、現時点ではComfyUIでの扱いやすさ、cover機能の実効性、音質改善の幅について見方が分かれているようだ。
少なくともこのスレッドでは、正式な説明だけで評価は固まっておらず、実際に動かした上での検証待ちという空気が強い。
参考リンク:


