概要
このリポジトリは、OpenAIのDALL-E(テキストから画像を生成するTransformerモデル)をPyTorchで実装・再現したものです。
生成された画像の品質をランキングするためのCLIPも組み込まれています。
機械学習の研究者や開発者、特にPyTorchを使用して画像生成モデルやテキスト・画像間の関連性を探求したいユーザーを対象としています。
Colabでのトレーニングや推論の例も提供されており、さまざまなデータセットでの学習事例が紹介されています。
これにより、テキスト記述に基づいた画像生成モデルの構築と実験が可能になります。
互換性・特徴
- Python
- GPU必須
- CLI
- Colab対応
- Text to Image
- Deep Learning
基本情報
| ライセンス | MIT |
| Stars | 5,628 |
| Forks | 642 |
| カテゴリ | 画像生成 |
| アクティビティ | mid |
最新のissue
- インストール中のエラー (更新: 2025-12-20 / Error while install)
- FashionGenデータセットで訓練されたDALLEの結果 💯 (更新: 2024-08-03 / DALLE trained on FashionGen Dataset RESULTS 💯)
- キング (更新: 2023-12-23 / King)
最新リリース: 1.6.6 (2023-05-24)
