18 repos · 6 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

stable-diffusion-v1-5

★ 1.1k creativeml-openrail-m 更新: 2024-09-07 GitHubで見る →

概要

Stable Diffusion v1-5は、テキストプロンプトから写実的な画像を生成できる潜在拡散モデルです。

Stable-Diffusion-v1-2をベースに、512×512解像度でファインチューニングされています。

Hugging FaceのDiffusersライブラリ、ComfyUI、Automatic1111、SD.Next、InvokeAIといった複数のプラットフォームで利用可能です。

主に研究目的を意図しており、芸術作品の生成や教育・クリエイティブツールでの応用が想定されています。

モデルには、完璧な写実性の欠如、判読可能なテキストのレンダリングの難しさ、顔の生成の課題、英語以外の言語での性能低下などの制限とバイアスがあります。

互換性・特徴

  • Stable Diffusion
  • Text-to-Image
  • Diffusers
  • ComfyUI対応
  • Automatic1111対応
  • Python

基本情報

ライセンスcreativeml-openrail-m
Likes1,094
Downloads1,535,519
Pipelinetext-to-image
カテゴリStable Diffusion / 画像生成
アクティビティmid

HuggingFace: https://huggingface.co/stable-diffusion-v1-5/stable-diffusion-v1-5