概要
Matrix-Game 3.0は、画像とテキストを入力に、長時間の一貫性を保った720pインタラクティブ動画をリアルタイム生成できるオープンソースの世界モデルです。
Unreal Engine由来の合成データ、ゲーム映像、実写拡張を組み合わせた大規模データ基盤、長期記憶付きDiT、少ステップ推論やINT8量子化による高速化が特徴です。
研究者や動画生成モデル開発者、複数GPU環境で最先端の対話型映像生成を試したい上級ユーザー向けです。
互換性・特徴
- Python
- CLI
- GPU必須
- マルチGPU対応
- Hugging Faceモデル
- 動画生成
基本情報
| ライセンス | apache-2.0 |
| Likes | 114 |
| Downloads | 531 |
| Pipeline | image-text-to-video |
| カテゴリ | 動画生成 |
| アクティビティ | mid |
HuggingFace: https://huggingface.co/Skywork/Matrix-Game-3.0
