概要
Uni-ViGUは、拡散モデルを基盤としたビデオジェネレータを通じて、ビデオの生成と理解を統一する革新的なフレームワークです。
ビデオ生成を中心とし、統一フローメソッドによってビデオとテキストのコヒーレントなマルチモーダル生成を実現します。
また、モダリティ駆動のMoEフレームワークと双方向トレーニングメカニズムを導入し、生成能力を理解タスクにも活用。
研究者や開発者が、高精度な動画生成と動画理解の両方を統合したAIモデルを効率的に構築・利用できることを目指しています。
互換性・特徴
- Python
- CLI
- GPU必須
- 動画生成
- 動画理解
- Diffusionモデル
基本情報
| ライセンス | Apache-2.0 |
| Stars | 32 |
| Forks | 1 |
| カテゴリ | マルチモーダル |
| アクティビティ | low |
最新のissue
- Uni-ViGU は long-horizon story generation に対応していますか? (更新: 2026-04-15 / does Uni-ViGU support long-horizon story generation)