概要
Stable Diffusion v1-5は、テキストプロンプトから写実的な画像を生成できる潜在拡散モデルです。
Stable-Diffusion-v1-2をベースに、512×512解像度でファインチューニングされています。
Hugging FaceのDiffusersライブラリ、ComfyUI、Automatic1111、SD.Next、InvokeAIといった複数のプラットフォームで利用可能です。
主に研究目的を意図しており、芸術作品の生成や教育・クリエイティブツールでの応用が想定されています。
モデルには、完璧な写実性の欠如、判読可能なテキストのレンダリングの難しさ、顔の生成の課題、英語以外の言語での性能低下などの制限とバイアスがあります。
互換性・特徴
- Stable Diffusion
- Text-to-Image
- Diffusers
- ComfyUI対応
- Automatic1111対応
- Python
基本情報
| ライセンス | creativeml-openrail-m |
| Likes | 1,094 |
| Downloads | 1,535,519 |
| Pipeline | text-to-image |
| カテゴリ | Stable Diffusion / 画像生成 |
| アクティビティ | mid |
HuggingFace: https://huggingface.co/stable-diffusion-v1-5/stable-diffusion-v1-5