3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

stable-diffusion-v1-5

★ 1.2k creativeml-openrail-m 更新: 2024-09-07 HFで見る →

概要

Stable Diffusion v1-5は、テキスト入力に基づいて写実的な画像を生成できる強力な潜在テキスト-画像拡散モデルです。

このモデルは、Stable Diffusion v1-2の重みを基に512×512の解像度で59.5万ステップのファインチューニングが施されており、高い画像生成能力を誇ります。

Hugging FaceのDiffusersライブラリとシームレスに連携するほか、ComfyUI、AUTOMATIC1111、SD.Next、InvokeAIといった人気の環境でも利用可能です。

画像生成に興味のある開発者やAIアーティスト、研究者など、幅広いユーザーがテキストから多様なビジュアルコンテンツを創造するために想定されています。

互換性・特徴

  • Text-to-Image
  • Diffusers対応
  • ComfyUI対応
  • AUTOMATIC1111対応
  • Python
  • GPU必須

基本情報

ライセンスcreativeml-openrail-m
Likes1,154
Downloads1,764,267
Pipelinetext-to-image
カテゴリ画像生成
アクティビティmid

HuggingFace: https://huggingface.co/stable-diffusion-v1-5/stable-diffusion-v1-5