3,702 repos GH 3,587 / HF 115 · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

imagen-pytorch

★ 8.4k ⑂ 800 MIT 更新: 2024-10-07 GitHubで見る →

概要

lucidrains/imagen-pytorchは、Googleが開発した最先端のText-to-Imageニューラルネットワーク「Imagen」のPyTorch実装です。

DALL-E2を凌駕する画像生成能力を誇り、テキストから高品質な画像を生成することを可能にします。

本実装は、大規模な事前学習済みT5モデルからのテキスト埋め込みに条件付けされたカスケード型DDPM(Denoising Diffusion Probabilistic Models)を核としています。

さらに、改善されたclassifier free guidanceのための動的クリッピング、ノイズレベル条件付け、そしてメモリ効率の良いUnetデザインなどの特徴を持ち、CLIPやprior networkを不要とすることで、よりシンプルかつ効果的なアーキテクチャを実現しています。

主にPyTorch環境で最先端のテキスト-画像変換技術を研究・開発したいエンジニアや研究者を想定しています。

互換性・特徴

  • PyTorch
  • Python
  • GPU必須
  • CLI

基本情報

ライセンスMIT
Stars8,414
Forks800
カテゴリ画像生成
アクティビティmid

最新のissue

最新リリース: 2.1.0 (2024-10-07)

GitHub: https://github.com/lucidrains/imagen-pytorch