概要
コンピュータの画面を視覚的に認識し、人間のようにPCを操作する自己進化型AIエージェントを構築するためのPythonフレームワーク。
テキストだけでなく画面上のUIを理解する「Vision-grounded」なアプローチを採用し、エージェント自身が成功体験からスキルを学習・記述していく階層型メモリが特徴。
高度な自律エージェントをローカル環境で開発したい開発者や研究者向け。
互換性・特徴
- Python
- CLI
- Web UI
- AI Agent
- LLM
基本情報
| ライセンス | MIT |
| Stars | 184 |
| Forks | 10 |
| カテゴリ | AIエージェント |
| アクティビティ | mid |