概要
NVIDIA DLIのカリキュラムに基づき、ディフュージョンモデル(DDPM、U-Net、CFG、CLIPコサイン類似度)をFashionMNISTデータセット上でPyTorchを用いてゼロから実装した学習用プロジェクトです。
ライブラリに依存せず、ディフュージョンモデルの核心概念を深く理解し、コードで再現することを目的としています。
わずか10エポックの学習でモデルの動作検証と安定した収束を確認でき、生成モデルの学習過程と動作原理を視覚的に理解できます。
想定ユーザーは、ディフュージョンモデルの理論と実装を実践的に学びたい開発者や研究者です。
互換性・特徴
- Python
- PyTorch
- GPU必須
- CLI
- 日本語対応
基本情報
| ライセンス | MIT |
| Stars | 1 |
| カテゴリ | 画像生成 |
| アクティビティ | low |
GitHub: https://github.com/AD-Styles/diffusion-models-from-scratch
