Benchmark

Anthropic

GPT-5.4がGACL首位、Game Agent Coding Leagueで78.07点を記録

Game Agent Coding Leagueの2026年3月結果で、OpenAIのGPT-5.4が総合78.07点で首位となりました。同リーグは、各モデルがゲームを直接プレイするのではなく、7種類のゲームを戦うエージェントコードを生成し...