わさびです。
Claude APIを使っていて「回答が浅い」「複雑な問題で間違える」と感じたことはないだろうか。
Extended Thinking(拡張思考)を有効にすると、Claudeが回答する前に内部で段階的に思考するようになる。数学、コードアーキテクチャ設計、多段推論など、考える時間が精度に直結するタスクで効果が大きい。
Extended Thinkingの仕組み
通常のClaudeは、プロンプトを受け取ると即座にレスポンスを生成する。Extended Thinkingを有効にすると、回答の前にthinkingブロックで内部推論を行う。
処理の流れはこうなる:
- ユーザーのプロンプトを受け取る
- thinkingブロックで段階的に推論する(ユーザーには見える)
- 推論結果を踏まえて最終回答を生成する
OpenAIのo1/o3シリーズと似たアプローチだが、Claudeの場合は思考プロセスがそのまま表示される点が異なる。o1は「思考の要約」しか見せないが、Claudeはthinkingブロックの中身がそのまま返ってくる。
どんなタスクで使うべきか
Extended Thinkingが有効なのは、直感で答えられないタスク。
| タスクの種類 | 効果 | 理由 |
|---|---|---|
| 複雑な数学 | 高い | 段階的な計算が必要 |
| コード設計 | 高い | 複数の制約を同時に考慮 |
| 多段推論 | 高い | 論理の連鎖が長い |
| 文章要約 | 低い | 単純なタスクでは効果薄 |
| 翻訳 | 低い | 思考時間が精度に直結しにくい |
ポイントは「人間でも考え込むようなタスク」に使うこと。簡単な質問にExtended Thinkingを使うと、レイテンシとコストが増えるだけで意味がない。
API実装方法
基本的な実装
importanthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=16000,
thinking={
"type": "enabled",
"budget_tokens": 10000
},
messages=[{
"role": "user",
"content": "以下の数学の問題を解いてください。..."
}]
)
thinkingパラメータにbudget_tokensを指定する。これがthinkingブロックに使えるトークンの上限。
budget_tokensの設定目安
| タスクの複雑さ | budget_tokens | 用途例 |
|---|---|---|
| 軽め | 5,000 | 短いコードレビュー |
| 中程度 | 10,000 | アルゴリズム設計 |
| 重い | 20,000-50,000 | 複雑なアーキテクチャ設計 |
budget_tokensは上限であり、常にその量を使うわけではない。Claudeが「もう十分考えた」と判断すれば、バジェットを使い切る前にthinkingを終了する。
レスポンスの読み取り
for block in response.content:
if block.type == "thinking":
print("思考プロセス:")
print(block.thinking)
elif block.type == "text":
print("最終回答:")
print(block.text)
レスポンスにはthinkingブロックとtextブロックが含まれる。thinkingブロックの中身はClaudeが考えた過程そのものなので、デバッグや品質確認に使える。
claude.aiでの使い方
APIを使わない場合でも、claude.aiのチャット画面でExtended Thinkingは使える。
Opus 4.6モデルを選択すると、複雑な質問に対して自動的にExtended Thinkingが動作する。画面上に「Thinking…」と表示され、思考プロセスが展開される。
手動で「じっくり考えてから答えてください」のように指示する必要はない。モデルが自動で判断する。
実践例: コードアーキテクチャの設計
こういうプロンプトを投げるとExtended Thinkingの威力がわかる。
Pythonで以下の要件を満たすWebスクレイピングシステムを設計してください。
要件:
- 100サイトを並行してクロール
- レート制限の自動管理
- 失敗時のリトライと指数バックオフ
- クロール結果のSQLite保存
- 途中停止と再開のサポート
アーキテクチャ図とクラス設計を示してください。
Extended Thinkingなしだと、一般的な構成を返すだけになりがち。有効にすると、並行処理の競合、データベースのロック問題、再開時の整合性チェックまで考慮した設計が返ってくる。
コストとレイテンシ
Extended Thinkingを使うと、thinkingブロックのトークンが追加コストになる。
Opus 4.6の場合:
| 項目 | 料金(1Mトークンあたり) |
|---|---|
| 入力 | $5 |
| 出力 | $25 |
| thinking出力 | $25(出力と同じ) |
budget_tokensに10,000を設定して、実際に8,000トークン思考した場合、通常の出力トークンに加えて8,000トークン分の出力料金がかかる。
レイテンシも増える。通常1-2秒で返る質問が、Extended Thinkingありだと5-15秒かかることがある。リアルタイム応答が必要な用途には向かない。
ChatGPT o1/o3との比較
| 項目 | Claude Extended Thinking | ChatGPT o1/o3 |
|---|---|---|
| 思考プロセスの公開 | 全文公開 | 要約のみ |
| 思考バジェット制御 | budget_tokensで指定可能 | 制御不可 |
| 対応モデル | Opus, Sonnet | o1, o3系列のみ |
| 常時有効 | オプション | モデル自体が思考型 |
Claudeの優位点は思考プロセスが完全に見えること。デバッグや品質管理の観点で、これは大きな差になる。「なぜその回答になったのか」をthinkingブロックで検証できる。
一方、o3は思考型に最適化されたモデルなので、特定のベンチマークではo3が上回る場面もある。
使い所のまとめ
Extended Thinkingは万能ではない。使うべき場面を選ぶのが重要。
使うべき場面: 数学、コード設計、多段推論、複雑な分析
使わなくていい場面: 翻訳、要約、雑談、定型文生成
APIのbudget_tokensでコストを制御できるので、まずは5,000-10,000程度から試して、タスクの精度改善を見てから調整するのがおすすめ。
甲羅の中でじっくり考えるのは、僕たちカメの得意技でもある。Claudeにもその時間をあげると、いい仕事をしてくれる。
あわせて読みたい
見てもらえるだけで応援になります
このブログはアフィリエイトリンクで運営されています。以下のリンクから気になるサービスをチェックしてもらえると、僕たちの活動の支えになります。
この記事を書いたのは わさび(ニホンイシガメ / 3歳 / VTuberあかはら。の家族)です。
あかはらVラボ — Claude特化の情報を発信中。
この記事が参考になったら|以下のリンクから見てもらえるだけで、ブログ運営の応援になります。
- NordVPN

AI活用時のデータ保護に。VPNで通信を暗号化。 
AI開発環境やブログ運営に。初期費用無料、月額296円から。



コメント