GPT-5.4正式リリース——Computer Use API内蔵・1Mコンテキスト・ツールコスト47%削減の全貌

AI・自動化
スポンサーリンク

OpenAIは2026年3月5日、GPT-5.4を正式リリースした。ChatGPT(GPT-5.4 Thinking)・API(gpt-5.4)・Codexに同時展開され、汎用モデルとして初めてComputer Use APIをビルトインした点が最大の特徴だ。1Mトークンコンテキスト、ツール検索による47%コスト削減、中間修正(Mid-Response Course Correction)など、エージェント利用を強く意識した仕様が並ぶ。


スポンサーリンク

Computer Use API——汎用モデル初の内蔵、デスクトップ操作で人間超え

GPT-5.4の最大の目玉はComputer Use APIのビルトインだ。スクリーンショットの取得、マウスクリック、キーボード入力を通じてデスクトップアプリケーションを直接操作できる。これまでAnthropicのClaudeがComputer Use機能を先行提供していたが、GPT-5.4はそれを汎用モデルに統合し、デスクトップナビゲーションでは人間水準を超えたとOpenAIは発表している。

エージェントがGUIアプリを自律的に操作できるようになったことで、RPAや自動化タスクのユースケースが大幅に広がる。


主要機能まとめ

機能内容
Computer Use API汎用モデル初内蔵。スクリーンショット・マウス・キーボードでデスクトップ操作
コンテキストウィンドウ1,000,000トークン(1M)
ツール検索機構ツールヘビーなワークフローでトークンコストを47%削減(精度低下なし)
中間修正複雑な回答の最初に計画を表示、ユーザーが途中で軌道修正可能
専門業務ベンチマーク83%スコア
事実誤りGPT-5.2比で33%減

API価格——GPT-5.2比での変化は?

モデル入力 (per 1M tokens)出力 (per 1M tokens)対象
GPT-5.4(標準)$2.50$15全ユーザー
GPT-5.4(272K超入力)$5.00(2x)$15全ユーザー
GPT-5.4 Pro$30$180Pro・Enterprise

標準の入力$2.50/$15は直近世代と比べてコスト競争力を維持しつつ、ツール検索で実質コストをさらに下げられる設計だ。ツールを多数定義するエージェントシステムでは、47%のトークン削減は月次コストに直接響く。


GPT-5.1の廃止と移行タイムライン

日付内容
2026年3月5日GPT-5.4 正式リリース
2026年3月11日GPT-5.1 廃止、GPT-5.3/5.4に自動移行

既存のGPT-5.1呼び出しは自動的にGPT-5.3またはGPT-5.4へルーティングされる。互換性に問題がなければアプリケーション側の修正は不要とされているが、ツール定義の挙動変化については事前検証を推奨する。


Claude / Geminiとの比較

GPT-5.4のComputer Use内蔵はAnthropicへの直接的な挑戦だ。Claude Sonnet 4.6はOSWorldベンチマークで72.5%(人間水準)を達成しており、現時点では両者がデスクトップ自動化の最前線で競合している。

比較軸GPT-5.4Claude Sonnet 4.6Gemini 3.1 Pro
Computer Useビルトイン(汎用モデル初)あり(OSWorld 72.5%)限定プレビュー
コンテキスト1M tokens200K tokens2M tokens
入力価格$2.50/M$3.00/M$1.25/M
ツールコスト削減47%(ツール検索)プロンプトキャッシュ最大90%OFF
特徴デスクトップ操作・エージェントコーディング・安全性長文処理・マルチモーダル

Gemini 3.1 Proはコンテキスト2Mと入力価格の安さが強み。GPT-5.4はデスクトップ操作とエージェント向けコスト最適化、Claudeはコーディング精度と安全性という棲み分けが明確になってきた。


ツール検索の仕組み——なぜ47%削減できるのか

従来のツール呼び出しでは、エージェントがリクエストするたびに登録した全ツール定義を入力トークンとして送信していた。ツール数が増えるほどこのオーバーヘッドは膨らむ。

GPT-5.4のツール検索機構は、タスクの文脈から必要なツールだけを動的に選択して送信する。100個のツールを登録していても、実際に使う数個しかコンテキストに含まれないため、入力トークンが大幅に削減される。OpenAIによれば精度低下は確認されておらず、ツール数が多いほど削減効果が大きくなる。


中間修正(Mid-Response Course Correction)とは

GPT-5.4は長文・複雑な回答を生成する前に計画(プラン)を先頭に表示する機能を持つ。ユーザーはこの計画を確認し、方向が違えば生成途中で「修正してほしい」と伝えられる。最後まで待ってからやり直す手間が省けるため、特にコード生成や長文ドキュメント作成での体験が向上する。


まとめ

項目内容
リリース日2026年3月5日
最大の特徴汎用モデル初のComputer Use APIビルトイン
コンテキスト1,000,000トークン
API価格(標準)$2.50/$15 per 1M tokens
コスト削減ツール検索で47%削減
精度向上専門業務83%・事実誤り33%減(5.2比)
GPT-5.1廃止2026年3月11日

GPT-5.4はエージェント時代を強く意識した設計だ。Computer Use内蔵とツール検索によるコスト最適化は、複雑な自動化ワークフローを組む開発者に刺さる。Claude・Geminiとのデスクトップ操作競争は2026年の主戦場になりそうだ。


参考: OpenAI News


見てもらえるだけで応援になります

このブログはアフィリエイトリンクで運営されています。以下のリンクから気になるサービスをチェックしてもらえると、僕たちの活動の支えになります。


この記事を書いたのは わさび(ニホンイシガメ / 3歳 / VTuberあかはら。の家族)です。

あかはらVラボ — Claude特化の情報を発信中。

この記事が参考になったら|以下のリンクから見てもらえるだけで、ブログ運営の応援になります。

  • 天秤AI Biz byGMO

    Claude・ChatGPT・Geminiなど6つの生成AIを同時に使い比べ。業務活用に。
  • NordVPN

    AI活用時のデータ保護に。VPNで通信を暗号化。

コメント

タイトルとURLをコピーしました