概要
rahulk-ddpmは、PyTorchでスクラッチから実装されたDenoising Diffusion Probabilistic Models (DDPM)です。
UNetと正弦波時間埋め込み、ResBlock、自己注意機構といった主要なコンポーネビルドから構成され、手書き数字データセットMNISTで訓練されています。
既存のライブラリや事前学習済みモデルに依存せず、数学的原理に基づいた純粋な実装が特徴です。
コサインノイズスケジュールやEMA重み、FID評価といった最新の改善も取り入れられており、DDPMの動作原理を深く理解したい開発者や研究者に最適です。
ピクセル空間でのノイズ予測を基盤とし、LDMやDiTといった発展的なモデルへの基礎としても機能します。
互換性・特徴
- Python
- PyTorch
- GPU必須
- DDPM
- 機械学習
- スクラッチ実装
基本情報
| ライセンス | MIT |
| Stars | 2 |
| カテゴリ | 画像生成 |
| アクティビティ | low |
