概要
ReVidgenは、具現化されたAI領域における動画生成モデルを再考するための公式実装リポジトリです。
本プロジェクトは、ロボット動画生成に特化した高精度なベンチマーク「RBench」と、ロボット動画モデルの学習に用いるミリオン規模の大規模データセット「RoVid-X」を提供します。
既存の動画基盤モデルの課題を明らかにし、改善の方向性を示すことで、物理AI分野の研究者が具現化されたAIの汎用知能への進歩を加速するための強固な基盤を提供します。
動画生成やロボティクス、強化学習分野の研究者を主な想定ユーザーとしています。
PythonとCLIによる利用が前提となります。
互換性・特徴
- Python
- CLI
- GPU必須
- 研究プロジェクト
- データセット提供
- ベンチマークツール
基本情報
| Stars | 72 |
| カテゴリ | 動画生成 |
| アクティビティ | low |
最新のissue
- データセットの完全版 (更新: 2026-03-18 / full version of dataset)
- RoVid-Xで使用されているBridgeデータセットの実際の解像度に関する質問 (Table 1) (更新: 2026-03-13 / Question about the actual resolution of Bridge dataset used in RoVid-X (Table 1))
- 完全なソースコードとデータセットのリクエスト (更新: 2026-03-10 / Full source code and dataset request)
- scriptsディレクトリ内の評価スクリプトの欠落 (更新: 2026-01-27 / Missing evaluation scripts in scripts directory)
