概要
HiARは、階層的な自己回帰型のビデオ生成ツールで、従来のブロックファースト型からステップファースト型へと処理を革新します。
これにより、長時間のビデオ生成におけるドリフトを抑制しつつ、時間的な一貫性を保ちます。
パイプライン並列推論に対応しており、複数のGPUを活用して効率的な処理が可能です。
また、forward-KL正則化器を用いることで、モーションの多様性を維持します。
特に注目すべきは、ビデオデータが不要な「データフリー」なトレーニングが可能である点です。
ビデオ生成の研究者や開発者、特に長尺で高品質なビデオを効率的に生成したいユーザーに適しています。
互換性・特徴
- Python
- CLI
- GPU必須
- HuggingFace対応
- 分散処理対応
基本情報
| ライセンス | Apache-2.0 |
| Stars | 150 |
| Forks | 6 |
| カテゴリ | 動画生成 |
| アクティビティ | mid |
最新のissue
- アルゴリズム1とパイプライン並列処理の記述におけるステップのインデックス付けに関する明確化 (更新: 2026-05-06 / Clarification on step indexing in Algorithm 1 vs. pipelined parallelism description)
- ODE軌道ペアデータセットへのHugging Faceリンク (更新: 2026-04-02 / Hugging Face link to ODE trajectory pairs dataset)
- ノイズの多いKVキャッシュとの比較に関する検討 (更新: 2026-03-13 / Comparison to noisy KV-cache)