NanoI2V

概要

NanoI2Vは、最先端の画像-動画変換（I2V）モデルをゼロから構築するためのステップバイステップのガイドです。

拡散ベースの動画生成モデルの仕組みを深く理解し、モーション、時間的一貫性、カメラダイナミクスを備えた動画を単一の画像から生成する方法を探求します。

VAE、DiT、フローマッチング、コンディショニング、トレーニングパイプラインなど、主要な構成要素をカバーしています。

PyTorch、Transformerアーキテクチャ、LLM、拡散モデルの基本を理解している開発者や研究者を対象としています。

GitHub: https://github.com/Shubham2376G/NanoI2V