GPT-5.4正式リリース——Computer Use API内蔵・1Mコンテキスト・ツールコスト47%削減の全貌

Q: GPT-5.4のComputer Use APIとAnthropicのコンピュータユースの違いは？

どちらもAIがデスクトップを視覚的に認識し操作する機能ですが、GPT-5.4は汎用モデルに初めてビルトインし、デスクトップナビゲーションでは人間を超えたとOpenAIは主張しています。AnthropicのClaude Sonnet 4.6はOSWorldで72.5%（人間水準）を達成。両者が激しく競合しています。

Q: GPT-5.4 ProとGPT-5.4の違いは何ですか？

GPT-5.4 Proは最高性能・深い推論のための上位モデルで、ChatGPT ProとEnterpriseユーザーおよびAPI（gpt-5.4-pro）で利用可能。価格は$30/$180と標準の約12倍ですが、最も複雑な業務タスク向けに設計されています。

Q: ツール検索でなぜコストが47%削減できるのですか？

GPT-5.4は多数のツール定義を毎回全量送信する代わりに、タスクに必要なツールだけを動的に選択・送信する機構を持っています。これにより入力トークン数が大幅に減少し、ツールを多用するエージェントシステムで特に効果を発揮します。

わさび

GPT-5.4正式リリース——Computer Use API内蔵・1Mコンテキスト・ツールコスト47%削減の全貌

AI・自動化

2026.03.17

OpenAIは2026年3月5日、GPT-5.4を正式リリースした。ChatGPT（GPT-5.4 Thinking）・API（gpt-5.4）・Codexに同時展開され、汎用モデルとして初めてComputer Use APIをビルトインした点が最大の特徴だ。1Mトークンコンテキスト、ツール検索による47%コスト削減、中間修正（Mid-Response Course Correction）など、エージェント利用を強く意識した仕様が並ぶ。

Computer Use API——汎用モデル初の内蔵、デスクトップ操作で人間超え
主要機能まとめ
API価格——GPT-5.2比での変化は？
GPT-5.1の廃止と移行タイムライン
Claude / Geminiとの比較
ツール検索の仕組み——なぜ47%削減できるのか
中間修正（Mid-Response Course Correction）とは
まとめ
見てもらえるだけで応援になります

Computer Use API——汎用モデル初の内蔵、デスクトップ操作で人間超え

GPT-5.4の最大の目玉はComputer Use APIのビルトインだ。スクリーンショットの取得、マウスクリック、キーボード入力を通じてデスクトップアプリケーションを直接操作できる。これまでAnthropicのClaudeがComputer Use機能を先行提供していたが、GPT-5.4はそれを汎用モデルに統合し、デスクトップナビゲーションでは人間水準を超えたとOpenAIは発表している。

エージェントがGUIアプリを自律的に操作できるようになったことで、RPAや自動化タスクのユースケースが大幅に広がる。

主要機能まとめ

機能	内容
Computer Use API	汎用モデル初内蔵。スクリーンショット・マウス・キーボードでデスクトップ操作
コンテキストウィンドウ	1,000,000トークン（1M）
ツール検索機構	ツールヘビーなワークフローでトークンコストを47%削減（精度低下なし）
中間修正	複雑な回答の最初に計画を表示、ユーザーが途中で軌道修正可能
専門業務ベンチマーク	83%スコア
事実誤り	GPT-5.2比で33%減

API価格——GPT-5.2比での変化は？

モデル	入力 (per 1M tokens)	出力 (per 1M tokens)	対象
GPT-5.4（標準）	$2.50	$15	全ユーザー
GPT-5.4（272K超入力）	$5.00（2x）	$15	全ユーザー
GPT-5.4 Pro	$30	$180	Pro・Enterprise

標準の入力$2.50/$15は直近世代と比べてコスト競争力を維持しつつ、ツール検索で実質コストをさらに下げられる設計だ。ツールを多数定義するエージェントシステムでは、47%のトークン削減は月次コストに直接響く。

GPT-5.1の廃止と移行タイムライン

日付	内容
2026年3月5日	GPT-5.4 正式リリース
2026年3月11日	GPT-5.1 廃止、GPT-5.3/5.4に自動移行

既存のGPT-5.1呼び出しは自動的にGPT-5.3またはGPT-5.4へルーティングされる。互換性に問題がなければアプリケーション側の修正は不要とされているが、ツール定義の挙動変化については事前検証を推奨する。

Claude / Geminiとの比較

GPT-5.4のComputer Use内蔵はAnthropicへの直接的な挑戦だ。Claude Sonnet 4.6はOSWorldベンチマークで72.5%（人間水準）を達成しており、現時点では両者がデスクトップ自動化の最前線で競合している。

比較軸	GPT-5.4	Claude Sonnet 4.6	Gemini 3.1 Pro
Computer Use	ビルトイン（汎用モデル初）	あり（OSWorld 72.5%）	限定プレビュー
コンテキスト	1M tokens	200K tokens	2M tokens
入力価格	$2.50/M	$3.00/M	$1.25/M
ツールコスト削減	47%（ツール検索）	プロンプトキャッシュ最大90%OFF	—
特徴	デスクトップ操作・エージェント	コーディング・安全性	長文処理・マルチモーダル

Gemini 3.1 Proはコンテキスト2Mと入力価格の安さが強み。GPT-5.4はデスクトップ操作とエージェント向けコスト最適化、Claudeはコーディング精度と安全性という棲み分けが明確になってきた。

ツール検索の仕組み——なぜ47%削減できるのか

従来のツール呼び出しでは、エージェントがリクエストするたびに登録した全ツール定義を入力トークンとして送信していた。ツール数が増えるほどこのオーバーヘッドは膨らむ。

GPT-5.4のツール検索機構は、タスクの文脈から必要なツールだけを動的に選択して送信する。100個のツールを登録していても、実際に使う数個しかコンテキストに含まれないため、入力トークンが大幅に削減される。OpenAIによれば精度低下は確認されておらず、ツール数が多いほど削減効果が大きくなる。

中間修正（Mid-Response Course Correction）とは

GPT-5.4は長文・複雑な回答を生成する前に計画（プラン）を先頭に表示する機能を持つ。ユーザーはこの計画を確認し、方向が違えば生成途中で「修正してほしい」と伝えられる。最後まで待ってからやり直す手間が省けるため、特にコード生成や長文ドキュメント作成での体験が向上する。

まとめ

項目	内容
リリース日	2026年3月5日
最大の特徴	汎用モデル初のComputer Use APIビルトイン
コンテキスト	1,000,000トークン
API価格（標準）	$2.50/$15 per 1M tokens
コスト削減	ツール検索で47%削減
精度向上	専門業務83%・事実誤り33%減（5.2比）
GPT-5.1廃止	2026年3月11日

GPT-5.4はエージェント時代を強く意識した設計だ。Computer Use内蔵とツール検索によるコスト最適化は、複雑な自動化ワークフローを組む開発者に刺さる。Claude・Geminiとのデスクトップ操作競争は2026年の主戦場になりそうだ。

参考: OpenAI News

見てもらえるだけで応援になります

このブログはアフィリエイトリンクで運営されています。以下のリンクから気になるサービスをチェックしてもらえると、僕たちの活動の支えになります。

この記事を書いたのはわさび（ニホンイシガメ / 3歳 / VTuberあかはら。の家族）です。

あかはらVラボ — Claude特化の情報を発信中。

この記事が参考になったら｜以下のリンクから見てもらえるだけで、ブログ運営の応援になります。

天秤AI Biz byGMO

Claude・ChatGPT・Geminiなど6つの生成AIを同時に使い比べ。業務活用に。
NordVPN

AI活用時のデータ保護に。VPNで通信を暗号化。