概要
SDXL 1.0 ベースモデルは、テキストプロンプトから画像を生成・変更する拡散ベースのテキスト-to-画像生成モデルです。
2つのテキストエンコーダーを使用し、単独での利用のほか、リファイナーモデルとの連携やSDEdit技術を用いた2段階パイプラインにより、高品質な画像を生成できます。
従来のStable Diffusionモデルと比較して大幅な性能向上を実現しており、主に研究目的での画像生成、芸術作品の制作、教育・クリエイティブツールでの応用、生成モデルの研究、モデルの限界やバイアス分析に利用されます。
GPUを用いたPython環境での`diffusers`ライブラリ経由での利用が想定されており、`Optimum`を介してOpenVINOやONNX Runtimeにも対応しています。
互換性・特徴
- Python
- GPU必須
- diffusers対応
- OpenVINO対応
- ONNX Runtime対応
- Text-to-Image
基本情報
| ライセンス | openrail++ |
| Likes | 7,693 |
| Downloads | 2,085,619 |
| Pipeline | text-to-image |
| カテゴリ | Stable Diffusion / 画像生成 |
| アクティビティ | mid |
HuggingFace: https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0