概要
本リポジトリは、ICML2026で発表される論文「Video2GUI: Synthesizing Large-Scale Interaction Trajectories for Generalized GUI Agent Pretraining」の関連コードです。
GUIエージェントの汎用事前学習のため、大規模なインタラクション軌跡を合成する技術に焦点を当てています。
具体的なツールの機能は不明ですが、GUI操作データ生成やシミュレーションの可能性が示唆されます。
また、関連データセット「WildGUI」が近日公開予定です。
GUIエージェントの研究開発者向けであり、AIエージェントの能力向上に貢献が期待されます。
基本情報
| ライセンス | Apache-2.0 |
| Stars | 31 |
| カテゴリ | LLM |
| アクティビティ | low |
最新のissue
- Hugging FaceでのWildGUIと事前学習済みチェックポイントのリリース (更新: 2026-05-22 / Release WildGUI and pre-trained checkpoints on Hugging Face)
- データリリース:新規データセットの公開準備とアナウンス (更新: 2026-05-19 / Data Release)
