OpenAIは2026年3月5日、GPT-5.4を正式リリースした。ChatGPT(GPT-5.4 Thinking)・API(gpt-5.4)・Codexに同時展開され、汎用モデルとして初めてComputer Use APIをビルトインした点が最大の特徴だ。1Mトークンコンテキスト、ツール検索による47%コスト削減、中間修正(Mid-Response Course Correction)など、エージェント利用を強く意識した仕様が並ぶ。
Computer Use API——汎用モデル初の内蔵、デスクトップ操作で人間超え
GPT-5.4の最大の目玉はComputer Use APIのビルトインだ。スクリーンショットの取得、マウスクリック、キーボード入力を通じてデスクトップアプリケーションを直接操作できる。これまでAnthropicのClaudeがComputer Use機能を先行提供していたが、GPT-5.4はそれを汎用モデルに統合し、デスクトップナビゲーションでは人間水準を超えたとOpenAIは発表している。
エージェントがGUIアプリを自律的に操作できるようになったことで、RPAや自動化タスクのユースケースが大幅に広がる。
主要機能まとめ
| 機能 | 内容 |
|---|---|
| Computer Use API | 汎用モデル初内蔵。スクリーンショット・マウス・キーボードでデスクトップ操作 |
| コンテキストウィンドウ | 1,000,000トークン(1M) |
| ツール検索機構 | ツールヘビーなワークフローでトークンコストを47%削減(精度低下なし) |
| 中間修正 | 複雑な回答の最初に計画を表示、ユーザーが途中で軌道修正可能 |
| 専門業務ベンチマーク | 83%スコア |
| 事実誤り | GPT-5.2比で33%減 |
API価格——GPT-5.2比での変化は?
| モデル | 入力 (per 1M tokens) | 出力 (per 1M tokens) | 対象 |
|---|---|---|---|
| GPT-5.4(標準) | $2.50 | $15 | 全ユーザー |
| GPT-5.4(272K超入力) | $5.00(2x) | $15 | 全ユーザー |
| GPT-5.4 Pro | $30 | $180 | Pro・Enterprise |
標準の入力$2.50/$15は直近世代と比べてコスト競争力を維持しつつ、ツール検索で実質コストをさらに下げられる設計だ。ツールを多数定義するエージェントシステムでは、47%のトークン削減は月次コストに直接響く。
GPT-5.1の廃止と移行タイムライン
| 日付 | 内容 |
|---|---|
| 2026年3月5日 | GPT-5.4 正式リリース |
| 2026年3月11日 | GPT-5.1 廃止、GPT-5.3/5.4に自動移行 |
既存のGPT-5.1呼び出しは自動的にGPT-5.3またはGPT-5.4へルーティングされる。互換性に問題がなければアプリケーション側の修正は不要とされているが、ツール定義の挙動変化については事前検証を推奨する。
Claude / Geminiとの比較
GPT-5.4のComputer Use内蔵はAnthropicへの直接的な挑戦だ。Claude Sonnet 4.6はOSWorldベンチマークで72.5%(人間水準)を達成しており、現時点では両者がデスクトップ自動化の最前線で競合している。
| 比較軸 | GPT-5.4 | Claude Sonnet 4.6 | Gemini 3.1 Pro |
|---|---|---|---|
| Computer Use | ビルトイン(汎用モデル初) | あり(OSWorld 72.5%) | 限定プレビュー |
| コンテキスト | 1M tokens | 200K tokens | 2M tokens |
| 入力価格 | $2.50/M | $3.00/M | $1.25/M |
| ツールコスト削減 | 47%(ツール検索) | プロンプトキャッシュ最大90%OFF | — |
| 特徴 | デスクトップ操作・エージェント | コーディング・安全性 | 長文処理・マルチモーダル |
Gemini 3.1 Proはコンテキスト2Mと入力価格の安さが強み。GPT-5.4はデスクトップ操作とエージェント向けコスト最適化、Claudeはコーディング精度と安全性という棲み分けが明確になってきた。
ツール検索の仕組み——なぜ47%削減できるのか
従来のツール呼び出しでは、エージェントがリクエストするたびに登録した全ツール定義を入力トークンとして送信していた。ツール数が増えるほどこのオーバーヘッドは膨らむ。
GPT-5.4のツール検索機構は、タスクの文脈から必要なツールだけを動的に選択して送信する。100個のツールを登録していても、実際に使う数個しかコンテキストに含まれないため、入力トークンが大幅に削減される。OpenAIによれば精度低下は確認されておらず、ツール数が多いほど削減効果が大きくなる。
中間修正(Mid-Response Course Correction)とは
GPT-5.4は長文・複雑な回答を生成する前に計画(プラン)を先頭に表示する機能を持つ。ユーザーはこの計画を確認し、方向が違えば生成途中で「修正してほしい」と伝えられる。最後まで待ってからやり直す手間が省けるため、特にコード生成や長文ドキュメント作成での体験が向上する。
まとめ
| 項目 | 内容 |
|---|---|
| リリース日 | 2026年3月5日 |
| 最大の特徴 | 汎用モデル初のComputer Use APIビルトイン |
| コンテキスト | 1,000,000トークン |
| API価格(標準) | $2.50/$15 per 1M tokens |
| コスト削減 | ツール検索で47%削減 |
| 精度向上 | 専門業務83%・事実誤り33%減(5.2比) |
| GPT-5.1廃止 | 2026年3月11日 |
GPT-5.4はエージェント時代を強く意識した設計だ。Computer Use内蔵とツール検索によるコスト最適化は、複雑な自動化ワークフローを組む開発者に刺さる。Claude・Geminiとのデスクトップ操作競争は2026年の主戦場になりそうだ。
参考: OpenAI News
見てもらえるだけで応援になります
このブログはアフィリエイトリンクで運営されています。以下のリンクから気になるサービスをチェックしてもらえると、僕たちの活動の支えになります。
この記事を書いたのは わさび(ニホンイシガメ / 3歳 / VTuberあかはら。の家族)です。
あかはらVラボ — Claude特化の情報を発信中。
この記事が参考になったら|以下のリンクから見てもらえるだけで、ブログ運営の応援になります。
- 天秤AI Biz byGMO

Claude・ChatGPT・Geminiなど6つの生成AIを同時に使い比べ。業務活用に。 - NordVPN

AI活用時のデータ保護に。VPNで通信を暗号化。



コメント