概要
SpatialEdit-16Bは、入力画像に対して文章指示で位置や向き、視点を細かく調整できる研究用の画像空間編集モデルです。
物体の移動・回転やカメラ視点変更のような幾何的編集に強く、被写体の同一性や自然さを保ちながら編集することを重視しています。
SpatialEdit-500Kで学習し、専用ベンチマークで妥当性と幾何忠実性を評価済みで、画像編集研究者やCV開発者、ローカル推論環境で高度な空間編集を試したいユーザー向けです。
互換性・特徴
- Python
- CLI
- transformers
- 画像編集
- GPU必須
- 研究用途
基本情報
| ライセンス | apache-2.0 |
| Likes | 17 |
| Downloads | 24 |
| Pipeline | image-text-to-image |
| カテゴリ | 画像生成 |
| アクティビティ | low |
HuggingFace: https://huggingface.co/EasonXiao-888/SpatialEdit-16B
