概要
MultiWorldは、マルチエージェント・マルチビュービデオ世界モデルのための統合フレームワークです。
複数のエージェントの正確な制御と、マルチビュー間の一貫性を維持することに重点を置いています。
エージェントのアイデンティティ埋め込みと適応型アクション重み付けによりマルチエージェントの制御可能性を、グローバルステートエンコーダが部分観測から3D環境情報を抽出することでマルチビューの一貫性を向上させます。
様々なエージェント数とカメラビューに効果的にスケールし、学習時より長いシーケンスの自己回帰生成も可能です。
ビデオ世界モデル、マルチエージェントシステム、機械学習の研究者や開発者、特に複雑なシミュレーションや環境でのビデオ生成・制御に関心のあるユーザーが対象です。
互換性・特徴
- Python
- GPU必須
- CLI
- HuggingFace対応
- ModelScope対応
- Conda環境
基本情報
| ライセンス | NOASSERTION |
| Stars | 201 |
| Forks | 11 |
| カテゴリ | 画像生成 |
| アクティビティ | mid |
