※記事内のリンクには広告(PR)を含む場合があります。

Anima Preview 3はIllustriousやPonyより上?自然言語理解と速度をめぐる反応

「Anima Preview 3はIllustriousやPonyより優れているのか」という投稿が、RedditのStable Diffusion界隈で注目を集めた。

自然言語への強さや文字描画を評価する声が出る一方で、速度やスタイル制御ではまだ既存モデルが強いという反論もぶつかっている。

circlestone-labs/Anima · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Anima Preview 3の話題の概要

今回の投稿者は、Civitaiで公開されたAnima Preview 3をかなり高く評価していた。

とくに注目されたのは、プロンプト追従性、自然言語理解、画像内テキスト表現である。

ただしコメント欄では、IllustriousやPonyをすぐ置き換えるほどかどうかをめぐって意見が割れた。

Anima Preview 3をめぐる実際のやり取り

自然言語理解とテキスト描画を評価する声

SDXLがもう3年近いことを考えれば、それくらい良くなっていてほしいよな。

プロンプトへの追従性と自然言語の扱いは、かなり大きな進歩だと思う。

それだけじゃなくて、VAEも良くなっているし、細部表現の伸びしろもありそうだ。

画像の中に文字を入れられるのは大きい。

SDXL系ではそこが弱かった。

実際、投稿内でも「boy on left、white van on right」のような位置指定がしやすいという声が出ており、場面構成のやりやすさを評価する流れが見えていた。

速度やスタイル制御はまだ議論が続く

でも、IllustriousやPonyをもう使いたくなくなるほどって本当か?

Illustriousは少しスタイルを足すだけで、もう十分に完成度の高いアニメ絵を出せるだろ。

今のところ、スタイルやキャラの制御はIllustriousの方がまだ上に見える。

いくつかのスタイルを学習させてみたけれど、IllustriousやNoobの結果には届かなかった。

残念ながら、最近のモデルで本当に速かったものは蒸留系くらいだ。

Animaはとくに2.5倍くらい遅い。

これに対して、SDXLが速いのは長年の最適化と不具合修正の積み重ねがあるからだという反論も付いていた。

一方で、DiT系は構造上どうしても計算量が重くなりやすく、将来的にも速度面は簡単には覆らないのではないかという慎重論も出ている。

Anima Preview 3への見方はまだ割れている

Anima Preview 3は、自然言語理解やレイアウト指示のしやすさに魅力を感じる人にはかなり刺さっているようである。

その反面、速度、スタイル再現、学習結果の安定感ではIllustriousや既存SDXL系を支持する声も根強い。

現時点では「即乗り換え確定」というより、何を重視するかで評価が分かれる新顔として見られている段階と言えそうだ。

参考リンク:

タイトルとURLをコピーしました