2月5日、AnthropicがClaude Opus 4.6をリリースした。GPT-5.3-Codexのリリース発表と同じ日だったというのが象徴的で、AI主要プレイヤーの開発競争がいよいよ同一日にぶつかり合うほど激しくなっている。
今回のOpus 4.6で何が変わったか、ポイントを整理してみた。
エージェントチームとは何か
Opus 4.6の目玉機能の一つが「エージェントチーム」だ。
複数のAIエージェントを同時に走らせ、それぞれが大きなプロジェクトの異なる部分を担当し、互いに通信しながら連携する——というものだ。人間のチームが仕事を分担して動くのに近い構造をAIで再現しようとしている。
これまでのClaudeは、一つの会話窓の中で一人のアシスタントとして動くのが基本だった。エージェントチームが機能すると、例えば「コードを書くエージェント」「テストを走らせるエージェント」「ドキュメントを更新するエージェント」が並列で動き、それぞれの結果を統合していくようなことが実現できる。
Claude Code上でこの構造が有効に機能すると、複雑な開発タスクの所要時間が大幅に圧縮される可能性がある。
実際、研究者のNicholas Carliniが「16体のOpus 4.6エージェントが協力してC言語コンパイラをRustで書き、Linuxカーネルのコンパイルに成功した」という実験結果を報告している。費用は約2万ドルかかったが、「このタスクをこなせた最初のモデル」という評価は注目に値する。
100万トークンのコンテキスト窓
もう一つの大きな変更点がコンテキスト窓の拡大だ。
100万トークンというのは具体的にどのくらいかというと、一般的な文庫本1冊がおよそ15〜20万文字程度なので、書籍4〜5冊分のテキストを一度に入力して処理できるボリュームになる。
これがコーディングや金融分析に効いてくる。
大規模なコードベースをまるごと入力してレビューを依頼する、あるいは何十本もの決算書や契約書を一度に読み込んで分析させるといったことが現実的なコストで実行できるようになる。
Anthropicがこの拡張に注力した背景には、Opus 4.6がFinance Agentベンチマーク1位を獲得した動向と一致している。膨大な金融文書を横断して分析するタスクは、コンテキスト窓の大きさが直接パフォーマンスに影響する領域だ。
コーディング性能の向上
Opus 4.6はコーディングでも強化が入っている。
計画立案、コードレビュー、デバッグの精度が上がり、大規模なコードベース内での信頼性が高まった。SWE-benchの最新評価でも前バージョンを上回るスコアが報告されている。
SWE-benchはGitHubの実際のIssueをAIが自律的に解決できるかを測る指標で、エージェント型のコーディング性能を測るのに使われることが多い。80%を超えるスコアはこの分野でのトップクラスの水準になる。
METRによる「タスク完了時間14時間30分」評価
AI能力評価機関METRが、Opus 4.6のタスク完了時間ホライズン(50%成功率でどれだけ長い連続タスクをこなせるか)を14時間30分と評価した。
この指標は「どれだけ長い作業を自律的に続けられるか」を示している。14時間超というのは、人間の1営業日分に相当する長さの作業を監視なしで継続できるということを意味する。
前世代のモデルに比べてこの数字が大幅に伸びており、AIエージェントを「一晩中走らせて朝に結果を確認する」という使い方が、より現実的になってきている。
株式市場への影響
Opus 4.6のリリースは予期せぬ形で市場にも影響を与えた。
AnthropicがOpus 4.6に企業向けソフトウェア連携プラグイン(Claude Cowork)を同時に発表したことで、SalesforceやServiceNowといった既存のエンタープライズSaaSの株価が急落した。「AIが従来の業務ソフトウェアを代替するのでは」という投資家の懸念が反応した形だ。
新しいモデルのリリースが、それを使うユーザーだけでなく関連企業の株価にまで波及する時代になっている。
Anthropicの現在地
Anthropicは同時期に、$380億ドル評価額での$300億ドルの資金調達ラウンドが完了したことを発表した。前回9月の評価額のほぼ2倍だ。
Opus 4.6の機能的な進化と、それに伴う市場への影響力の大きさを見ると、Anthropicが「安全性を重視する研究機関」から「市場のメインプレイヤー」へとシフトしていることがよくわかる。
Claude Codeが25億ドルARRに達したという報告もある(別記事で詳しく扱った)。コーディング用途のAIとして、すでに大きな収益規模を持つ事業になっている。
あわせて読みたい
- Claude Codeとは何か:基本と使い方完全ガイド
- Claude Codeで$25B ARRを達成したAnthropicの成長戦略
- LLMランキング2026:主要モデルの最新評価
- AIコーディングツール比較2026:CursorvsWindsurfvsGitHub Copilot
- GPT-5.3-Codexレビュー:コーディングエージェントの新時代
- LLM APIの料金比較2026年最新版
- Claude、App Store 1位——Anthropicの安全性重視が支持された逆転劇
この記事が参考になったら|以下のリンクから見てもらえるだけで、ブログ運営の応援になります。
- NordVPN

AI活用時のデータ保護に。VPNで通信を暗号化。 
AI開発環境やブログ運営に。初期費用無料、月額296円から。



コメント