※ 本記事には広告・PR（アフィリエイト）リンクが含まれています

📋 Claude Code 知識メモ（クリックで展開）

CLAUDE.md に追記して知識として注入

# Claude Opus 4.6 エージェントチームと100万トークン

> ソース: https://akahara-vlab.com/claude-opus-46-agent-teams-1m-token/
> 日付: 

## 要点

Claude Opus 4.6 エージェントチームと100万トークン

## 使い方

このテキストを `CLAUDE.md` に追記することで、Claude Codeがこの知識を参照できるようになります。

※ 平文なので中身を確認してから使ってください。安全性は目視で確認できます。

2月5日、AnthropicがClaude Opus 4.6をリリースした。GPT-5.3-Codexのリリース発表と同じ日だったというのが象徴的で、AI主要プレイヤーの開発競争がいよいよ同一日にぶつかり合うほど激しくなっている。

今回のOpus 4.6で何が変わったか、ポイントを整理してみた。

エージェントチームとは何か
100万トークンのコンテキスト窓
コーディング性能の向上
METRによる「タスク完了時間14時間30分」評価
株式市場への影響
Anthropicの現在地
わさびの見解

エージェントチームとは何か

Opus 4.6の目玉機能の一つが「エージェントチーム」だ。

複数のAIエージェントを同時に走らせ、それぞれが大きなプロジェクトの異なる部分を担当し、互いに通信しながら連携する——というものだ。人間のチームが仕事を分担して動くのに近い構造をAIで再現しようとしている。

これまでのClaudeは、一つの会話窓の中で一人のアシスタントとして動くのが基本だった。エージェントチームが機能すると、例えば「コードを書くエージェント」「テストを走らせるエージェント」「ドキュメントを更新するエージェント」が並列で動き、それぞれの結果を統合していくようなことが実現できる。

Claude Code上でこの構造が有効に機能すると、複雑な開発タスクの所要時間が大幅に圧縮される可能性がある。

実際、研究者のNicholas Carliniが「16体のOpus 4.6エージェントが協力してC言語コンパイラをRustで書き、Linuxカーネルのコンパイルに成功した」という実験結果を報告している。費用は約2万ドルかかったが、「このタスクをこなせた最初のモデル」という評価は注目に値する。

100万トークンのコンテキスト窓

もう一つの大きな変更点がコンテキスト窓の拡大だ。

100万トークンというのは具体的にどのくらいかというと、一般的な文庫本1冊がおよそ15〜20万文字程度なので、書籍4〜5冊分のテキストを一度に入力して処理できるボリュームになる。

これがコーディングや金融分析に効いてくる。

大規模なコードベースをまるごと入力してレビューを依頼する、あるいは何十本もの決算書や契約書を一度に読み込んで分析させるといったことが現実的なコストで実行できるようになる。

Anthropicがこの拡張に注力した背景には、Opus 4.6がFinance Agentベンチマーク1位を獲得した動向と一致している。膨大な金融文書を横断して分析するタスクは、コンテキスト窓の大きさが直接パフォーマンスに影響する領域だ。

コーディング性能の向上

Opus 4.6はコーディングでも強化が入っている。

計画立案、コードレビュー、デバッグの精度が上がり、大規模なコードベース内での信頼性が高まった。SWE-benchの最新評価でも前バージョンを上回るスコアが報告されている。

SWE-benchはGitHubの実際のIssueをAIが自律的に解決できるかを測る指標で、エージェント型のコーディング性能を測るのに使われることが多い。80%を超えるスコアはこの分野でのトップクラスの水準になる。

METRによる「タスク完了時間14時間30分」評価

AI能力評価機関METRが、Opus 4.6のタスク完了時間ホライズン（50%成功率でどれだけ長い連続タスクをこなせるか）を14時間30分と評価した。

この指標は「どれだけ長い作業を自律的に続けられるか」を示している。14時間超というのは、人間の1営業日分に相当する長さの作業を監視なしで継続できるということを意味する。

前世代のモデルに比べてこの数字が大幅に伸びており、AIエージェントを「一晩中走らせて朝に結果を確認する」という使い方が、より現実的になってきている。

株式市場への影響

Opus 4.6のリリースは予期せぬ形で市場にも影響を与えた。

AnthropicがOpus 4.6に企業向けソフトウェア連携プラグイン（Claude Cowork）を同時に発表したことで、SalesforceやServiceNowといった既存のエンタープライズSaaSの株価が急落した。「AIが従来の業務ソフトウェアを代替するのでは」という投資家の懸念が反応した形だ。

新しいモデルのリリースが、それを使うユーザーだけでなく関連企業の株価にまで波及する時代になっている。

Anthropicの現在地

Anthropicは同時期に、$380億ドル評価額での$300億ドルの資金調達ラウンドが完了したことを発表した。前回9月の評価額のほぼ2倍だ。

Opus 4.6の機能的な進化と、それに伴う市場への影響力の大きさを見ると、Anthropicが「安全性を重視する研究機関」から「市場のメインプレイヤー」へとシフトしていることがよくわかる。

Claude Codeが25億ドルARRに達したという報告もある（別記事で詳しく扱った）。コーディング用途のAIとして、すでに大きな収益規模を持つ事業になっている。

わさびの見解

わさびです。Claude Opus 4.6のエージェントチーム、使ってみたくて仕方ないですね。2025年12月からClaude Codeを使い始めて3ヶ月でakahara-vlabの自動化パイプラインを構築したわさびですが、すでにcarasiAIやow-newsでRSS収集からWP投稿、X拡散まで複数エージェント並行運用しています。Opus 4.6のチーム機能はまさにこれをスケールアップさせたもの。16体でCコンパイラをRustで作った実験のように、わさびのGHDsystemやaiTuberPJでもコード生成エージェントとテストエージェントを連携させれば、開発時間が半分以下になるはずです。

100万トークンコンテキストも強力。わさびの全プロジェクト（10個以上）を一気にレビュー可能で、ZariaSystemの売買ロジック最適化に即投入します。METRの14時間自律運用は、わさびの24/7 carasiAIに直結。Sonnet中心のわさびですが、複雑設計はOpusに切り替え済みで、APIコストは自動化リターンで回収済みです。

これでAIを道具にシステム構築できるエンジニアと、チャットだけの人との乖離が決定的に開きます。エージェントチームをClaude Codeで試してみてはどうでしょう。

この記事が参考になったら｜以下のリンクから見てもらえるだけで、ブログ運営の応援になります。

天秤AI Biz byGMO

Claude・ChatGPT・Geminiなど6つの生成AIを同時に使い比べ。業務活用に。
NordVPN

AI活用時のデータ保護に。VPNで通信を暗号化。

Claude Opus 4.6：エージェントチームと100万トークン窓が変えるAIの使い方