※記事内のリンクには広告(PR)を含む場合があります。

ACE-Step 1.5 XL公開で期待高まるも、ComfyUI対応や使い勝手には不安の声

ACE-Step 1.5 XLの公開を受けて、Redditでは「ComfyUIですぐ使えるのか」「前版より本当に良くなったのか」をめぐって反応が割れている。

ACE-Step 1.5 XLの概要

今回話題になったのは、ACE-Step 1.5 XLの公開とHugging Face上の説明である。

コメント欄では、導入直後の動作報告だけでなく、cover対応の実態や音質面の進歩にも話題が広がっていた。

ACE-Step 1.5 XLをめぐる実際のやり取り

ComfyUIで今すぐ動くのか

でもまだComfyでは動かない。ノードを更新しないといけない気がする。

nightlyなら動くはずだ。

自分の環境ではモデルの読み込みに失敗する。ComfyUIのnightlyが必要なのかもしれない。

新しいインストールでnightlyに切り替えていなかっただけだった。nightlyでは動いた。

公開直後ということもあり、まずは動く環境と動かない環境の報告が先に集まっている。

cover対応の説明をそのまま信じていいのか

coverとrepaintもできるらしい。

本当にcoverができるなら最高だが、自分にはまだそう見えない。どこで確認したんだ。

Hugging Faceの説明では、XL版はtext-to-music、cover、repaint、extractなどを支える基盤モデルだと書かれている。

前の版もcover対応と書いてあったが、実際はそこまででもなかった。自分の環境で動くようになってから試したい。

仕様表の文言だけでは信用しきれず、実際に触って確かめたいという反応が目立つ。

前版より良くなったのか、音質はどうなのか

ここ数か月追えていなかった。前のリリースはどの程度だったのか、XLに何を期待すればいいのか、短く知りたい。

前の版はまあまあだった。XLは目に見えて良くなっているし、GitHubのリンク先にあるオンライン生成も試せる。

1.5公開時に試したが、実用的なものはほとんど作れなかった。今回ははっきり良くなっていてほしい。

ACE-StepでSunoっぽい曲が出ることはあるし、一部では上回ることもある。ただかなり稀で、ワークフロー以外の工夫も必要だった。自分のテストでは、プロンプトの癖、金属っぽい音、歌詞の弱さ、3分制限などが気になった。

品質面の違和感は学習データ由来かもしれない。実際、できあがる曲にはロイヤリティフリー音源っぽさが強く出ることがあった。

ここでは評価がかなり割れており、XLで改善したという声と、前版から続く不満を引きずっている声が同時に並んでいる。

使い方の難しさも壁になっている

すごい。ただ、どう使えばいいのかまだ分からない。shardの統合やfp16化を誰かがやってくれるのを待ったほうが早いのかもしれない。そもそもComfyUIが対応しているのかも気になる。

StarNodes拡張を使えば自分でもできるし、XLは従来のワークフローでも動く。

モデルそのものの評価だけでなく、導入手順の分かりにくさもハードルとして語られていた。

見解まとめ

ACE-Step 1.5 XLには期待が集まっている一方で、現時点ではComfyUIでの扱いやすさ、cover機能の実効性、音質改善の幅について見方が分かれているようだ。

少なくともこのスレッドでは、正式な説明だけで評価は固まっておらず、実際に動かした上での検証待ちという空気が強い。

参考リンク:

タイトルとURLをコピーしました