stable-diffusion-v1-5

概要

Stable Diffusion v1-5は、テキスト入力に基づいて写実的な画像を生成できる強力な潜在テキスト-画像拡散モデルです。

このモデルは、Stable Diffusion v1-2の重みを基に512×512の解像度で59.5万ステップのファインチューニングが施されており、高い画像生成能力を誇ります。

Hugging FaceのDiffusersライブラリとシームレスに連携するほか、ComfyUI、AUTOMATIC1111、SD.Next、InvokeAIといった人気の環境でも利用可能です。

画像生成に興味のある開発者やAIアーティスト、研究者など、幅広いユーザーがテキストから多様なビジュアルコンテンツを創造するために想定されています。

HuggingFace: https://huggingface.co/stable-diffusion-v1-5/stable-diffusion-v1-5