OpenAI、GPT-5.4を発表　推論・コーディング・コンピュータ操作を強化

OpenAIは2026年3月6日、推論・コーディング・エージェント的な作業を重視した新モデル「GPT-5.4」をChatGPT、API、Codexで順次展開すると発表しました。

GPT-5.4の概要

OpenAI公式ブログによると、GPT-5.4は専門的な業務向けに設計された最新のフロンティアモデルです。

ChatGPTでは「GPT-5.4 Thinking」として提供され、複雑な依頼では冒頭に作業方針を示し、応答の途中で利用者が方向修正できる仕組みも導入されました。

APIとCodexでは、より高難度の処理向けに「GPT-5.4 Pro」も公開された形です。

OpenAIは、GPT-5.4が推論、コーディング、エージェントワークフローの進歩を1つに統合したと説明しました。

知識労働タスクを測るGDPvalでは83.0%を記録し、GPT-5.2の70.9%を上回ったとのことです。

表計算や文書、プレゼンテーションの作成能力も重点的に改善されました。

社内評価では、投資銀行アナリスト向けの表計算課題で87.3%を示し、GPT-5.2の68.4%から伸びが見られた状況です。

GPT-5.4は、OpenAIとして初の汎用モデル向けネイティブなコンピュータ操作機能を備えました。

OSWorld-Verifiedでは75.0%の成功率を記録し、GPT-5.2の47.3%を大きく上回った結果です。

この数値は、人間ベースライン72.4%も超えたとOpenAIは公表しました。

APIでは多数のツールを扱いやすくする「tool search」も追加され、MCP Atlasの250タスク評価では同等精度のまま総トークン使用量を47%削減したとされています。

BrowseCompではGPT-5.4が82.7%、GPT-5.4 Proが89.3%を記録しました。

OpenAIは、難しい情報探索で複数回のWeb検索を続けやすくなったと案内しています。

コンテキスト長は最大100万トークンに対応し、長い作業工程をまたぐ計画や検証にも使える設計。

さらにGPT-5.2比で少ないトークンで問題を解けるようになり、速度とコストの両面で効率改善がうたわれました。

OpenAIによると、GPT-5.4 ThinkingはChatGPT Plus、Team、Pro向けに順次展開され、GPT-5.2 Thinkingを置き換えます。

ただしGPT-5.2 Thinkingは有料ユーザー向けのLegacy Models内で3か月間維持され、2026年6月5日に終了予定です。

GPT-5.4 ProはProとEnterpriseで利用できます。

API価格はgpt-5.4が入力100万トークン当たり2.50ドル、出力100万トークン当たり15ドルです。

gpt-5.4-proは入力100万トークン当たり30ドル、出力100万トークン当たり180ドルに設定されたかたち。

OpenAIは性能向上に伴い単価は上がる一方、トークン効率の改善で総使用量の削減も見込めるとしています。

Redditでは、47%のトークン削減が実運用でも再現されるなら大きいという期待が見られました。

GPT-5.4のベンチマーク成績を踏まえ、他モデルとの比較対象として試してみたいという反応も出ています。

新モデル投入を受けて、CLIやCodexでの改善幅に関心を示す利用者もいた。

一方で、数値上の改善が実際の体験向上につながるのか疑問視する意見も目立ちました。

ベンチマークの見せ方に偏りがあるのではないか、未掲載の評価も示してほしいという指摘があります。

モデル名の整理が分かりにくい、公開間隔が短すぎる、まだ利用画面に表示されないなど、提供方法への戸惑いも確認されました。

加えて、拒否応答の多さや偏り、幻覚の残存を懸念する投稿もあり、平均的な利用者には違いが分かりにくいという見方も出た状況です。

参考リンク：