
CircleStone LabsとComfy Orgによる画像生成モデルAnimaの「Preview 2」がHugging Faceで公開されました。
学習条件の見直しや学習時間の延長により、LoRAなどの微調整耐性や自然言語理解の改善を図ったと説明されています。
Anima Preview 2の更新内容
学習の見直しと知識拡張
Hugging Faceの説明によると、Preview 2では学習の一部を異なるハイパーパラメータと手法でやり直し、ファインチューニングに対する頑健性を高めたとしています。
中解像度でより長く学習させることで、キャラクターに関する知識を増やしたとも案内されました。
さらに、正則化データセットを導入し、自然言語理解とアニメ以外の知識保持を改善したと述べています。
一方で、解像度の制約はPreview 1と同様で、1024解像度の学習は短時間にとどまるため、高解像度へ大きく伸ばすと破綻しやすい点も明記されています。
モデルの位置付け
Animaは20億パラメータのテキスト画像生成モデルです。
主にアニメ系の概念やキャラクター、スタイルを対象にしつつ、非写実系の幅広い表現にも対応すると説明されています。
美的チューニングは施されておらず、創造性の広さを重視したベースモデルという位置付けです。
Anima Preview 2に対するSNSの反応
SNSでは、言語理解の向上や細部描写の改善を歓迎する声が目立ちました。
LoRAを再学習したところ、より狙った作風に戻しやすくなったという報告もあります。
その一方で、暗いシーンがやや明るく寄りやすいのではないか、背景表現や高解像度対応にはまだ課題があるのではないかという指摘もありました。
非商用ライセンスや解像度制限を惜しむ声も見られます。
全体としては、Preview 1からの着実な改良として前向きに受け止められている様子です。
Anima Preview 2の注目点
今回の更新は、単なる画風調整ではなく、微調整しやすさや自然言語での扱いやすさを重視している点が特徴です。
今後、正式版や関連チェックポイントがどこまで性能を伸ばすかに関心が集まりそうです。
参考リンク:


