概要
Mobile-Agentは、Alibaba GroupのTongyi Labが開発した強力なGUIエージェントファミリーです。
デスクトップ、モバイル、ブラウザのGUI自動化を可能にし、20以上のGUIベンチマークで最先端の性能を発揮します。
GUI-Owl-1.5シリーズとして、Instruct & Thinking機能を備えた大規模な基盤モデルを提供し、エンドツーエンドのタスク実行、グラウンディング、ツール呼び出し、長期記憶に優れています。
最近リリースされたToolCUAは、最適なGUI-Toolパスオーケストレーションを実現し、GUI操作とツール利用の切り替えを効率化します。
オンラインデモを通じて手軽に体験できるため、GUI自動化に関心のある開発者や研究者、および複雑なGUIタスクの自動化を目指すユーザーに最適です。
互換性・特徴
- AIエージェント
- GUI自動化
- デスクトップ対応
- モバイル対応
- ブラウザ対応
- Python
基本情報
| ライセンス | MIT |
| Stars | 8,812 |
| Forks | 885 |
| カテゴリ | マルチモーダル |
| アクティビティ | high |
最新のissue
- Mobile-Agent-v3.5 image preprocessing uses factor=28, but Qwen3-style GUI-Owl-1.5 visual token block seems to require factor=32 (更新: 2026-05-29)
- 在OSWorld-MCP上测评Mobile-Agent-v3.5 (更新: 2026-05-26)
- 关于执行Mobile-Agent-v3.5/mobile_use 的python run_gui_owl_1_5_for_mobile.py (更新: 2026-05-25)
- MobileAgent/PC-Agent 项目执行的时候出现ModuleNotFoundError: No module named ‘OpenOCR’ (更新: 2026-05-25)
