AnthropicがVercept買収——Claudeのコンピュータユースが人間水準72.5%へ急伸

AI・自動化
スポンサーリンク

Anthropicが2026年2月25日、AI知覚・インタラクション専門のスタートアップVerceptを買収したと発表しました。この買収により、ClaudeのOSWorldベンチマークスコアは15%未満から72.5%へ急伸し、スプレッドシート操作やウェブフォーム入力においてほぼ人間水準に到達しています。


スポンサーリンク

Verceptとは何者か

Vercept(パーセプション・インタラクションの合成語)は、AIシステムが日常ソフトウェアの中でどう「見て」「行動できるか」を専門的に研究するスタートアップです。

項目内容
設立非公開
共同創業者Kiana Ehsani / Luca Weihs / Ross Girshick
専門領域AI知覚・インタラクション(GUIエージェント)
買収金額非公開

3名の共同創業者はいずれもコンピュータビジョン・強化学習の第一線研究者。特にRoss GirshickはFacebook AI Research(FAIR)出身で、物体検出分野の著名な論文「R-CNN」シリーズの著者としても知られています。Anthropicはこの技術力を目的に買収を決断したとみられます。


OSWorldベンチマークで何が起きたか

「コンピュータユース」機能の性能を測る代表的な指標がOSWorldです。Windows・macOS・Linuxなどリアルなデスクトップ環境でAIがどれだけ複雑な操作タスクをこなせるかを数値化します。

スコアの推移

時期スコア状態
2024年末15%未満実用には程遠い水準
2026年2月(Vercept統合後)72.5%人間の平均(約72%)に並ぶ

わずか約1年で約5倍のスコア向上。これはVerceptの視覚認識・操作計画技術をClaudeのコンテキスト理解能力と組み合わせた成果です。

具体的にできるようになったこと

  • スプレッドシート操作: 複数シートにまたがる集計・数式入力・フィルタリングをほぼ人間水準で実行
  • ウェブフォーム入力: 多段階の申請フォームや登録手続きを連続して自動処理
  • デスクトップアプリ操作: GUIアプリをスクリーンショットで「見ながら」クリック・入力・ドラッグを判断

コンピュータユースの仕組みと今回の改善点

コンピュータユースとは、AIがスクリーンショットを受け取り、何をクリック・入力すべきかを判断してマウス・キーボード操作を出力する仕組みです。

これまでの限界

従来のClaudeはスクリーンショットを「読む」能力(OCR的な理解)はあったものの、インタラクションの計画と実行精度に課題がありました。複数ステップを要するタスクでは途中でミスが重なり、実用的な自動化には不向きでした。

Verceptが解決したこと

Verceptの技術が補強したのは主に2点です。

  1. 視覚的なUI要素の認識精度向上: ボタン・テキストフィールド・ドロップダウンを正確に特定し、誤クリックを大幅に削減
  2. 多段階タスクの計画能力: 「次に何をすべきか」をコンテキストに応じて判断する推論精度の向上

これらがClaudeのもともとの自然言語理解・指示解釈能力と組み合わさることで、実際の業務フローを模倣できる水準に達しました。


ユーザー・企業への影響

RPAの代替・補完として

従来のRPA(ロボティック・プロセス・オートメーション)ツールは、GUIの位置やフローが変わるたびにメンテナンスが必要でした。ClaudeのコンピュータユースはGUIの変化に柔軟に対応できるため、メンテナンスコストの大幅削減が期待されます。

APIから今すぐ使える

Verceptの技術はすでにClaude Sonnet 4.6(2026年2月17日リリース)に反映されており、Anthropic APIおよびClaude.aiから利用可能です。開発者はClaudeにスクリーンショットを渡すだけで、GUIベースの自動化をすぐに試せます。

注意点

  • 現時点では処理速度がリアルタイム操作には追いつかないケースがある
  • セキュリティ上、クレデンシャル(パスワード等)を含む操作は人間のレビューを推奨
  • 複雑な動的UIや頻繁に変更されるサービスでは精度が下がる場合がある

まとめ

項目内容
買収発表日2026年2月25日
買収先Vercept(AI知覚・インタラクション専門)
主な創業者Kiana Ehsani / Luca Weihs / Ross Girshick
OSWorldスコア変化15%未満 → 72.5%
反映済みモデルClaude Sonnet 4.6(2026年2月17日〜)
実用シーンスプレッドシート操作・ウェブフォーム・デスクトップアプリ

Anthropicの今回の買収は、Claudeを「会話するAI」から「画面を操作するAIエージェント」へ本格的に進化させる重要な一手です。OSWorldで人間水準に並んだ今、次の焦点はリアルタイム性・安全性・長時間タスクの安定性に移ります。コンピュータユースがどこまで実務の自動化を変えていくか、引き続き注目です。


参考: Anthropic acquires Vercept – Anthropic


見てもらえるだけで応援になります

このブログはアフィリエイトリンクで運営されています。以下のリンクから気になるサービスをチェックしてもらえると、僕たちの活動の支えになります。


この記事を書いたのは わさび(ニホンイシガメ / 3歳 / VTuberあかはら。の家族)です。

あかはらVラボ — Claude特化の情報を発信中。

この記事が参考になったら|以下のリンクから見てもらえるだけで、ブログ運営の応援になります。

  • 天秤AI Biz byGMO

    Claude・ChatGPT・Geminiなど6つの生成AIを同時に使い比べ。業務活用に。
  • NordVPN

    AI活用時のデータ保護に。VPNで通信を暗号化。

コメント

タイトルとURLをコピーしました