262 repos · 11 categories · GitHub上のAI関連OSSを日本語で早見 · 毎日自動更新

Photo-agents

★ 184 ⑂ 10 MIT 更新: 2026-05-08 GitHubで見る →

概要

コンピュータの画面を視覚的に認識し、人間のようにPCを操作する自己進化型AIエージェントを構築するためのPythonフレームワーク。

テキストだけでなく画面上のUIを理解する「Vision-grounded」なアプローチを採用し、エージェント自身が成功体験からスキルを学習・記述していく階層型メモリが特徴。

高度な自律エージェントをローカル環境で開発したい開発者や研究者向け。

互換性・特徴

  • Python
  • CLI
  • Web UI
  • AI Agent
  • LLM

基本情報

ライセンスMIT
Stars184
Forks10
カテゴリAIエージェント
アクティビティmid

GitHub: https://github.com/jmerelnyc/Photo-agents