Anthropicが2026年2月25日、AI知覚・インタラクション専門のスタートアップVerceptを買収したと発表しました。この買収により、ClaudeのOSWorldベンチマークスコアは15%未満から72.5%へ急伸し、スプレッドシート操作やウェブフォーム入力においてほぼ人間水準に到達しています。
Verceptとは何者か
Vercept(パーセプション・インタラクションの合成語)は、AIシステムが日常ソフトウェアの中でどう「見て」「行動できるか」を専門的に研究するスタートアップです。
| 項目 | 内容 |
|---|---|
| 設立 | 非公開 |
| 共同創業者 | Kiana Ehsani / Luca Weihs / Ross Girshick |
| 専門領域 | AI知覚・インタラクション(GUIエージェント) |
| 買収金額 | 非公開 |
3名の共同創業者はいずれもコンピュータビジョン・強化学習の第一線研究者。特にRoss GirshickはFacebook AI Research(FAIR)出身で、物体検出分野の著名な論文「R-CNN」シリーズの著者としても知られています。Anthropicはこの技術力を目的に買収を決断したとみられます。
OSWorldベンチマークで何が起きたか
「コンピュータユース」機能の性能を測る代表的な指標がOSWorldです。Windows・macOS・Linuxなどリアルなデスクトップ環境でAIがどれだけ複雑な操作タスクをこなせるかを数値化します。
スコアの推移
| 時期 | スコア | 状態 |
|---|---|---|
| 2024年末 | 15%未満 | 実用には程遠い水準 |
| 2026年2月(Vercept統合後) | 72.5% | 人間の平均(約72%)に並ぶ |
わずか約1年で約5倍のスコア向上。これはVerceptの視覚認識・操作計画技術をClaudeのコンテキスト理解能力と組み合わせた成果です。
具体的にできるようになったこと
- スプレッドシート操作: 複数シートにまたがる集計・数式入力・フィルタリングをほぼ人間水準で実行
- ウェブフォーム入力: 多段階の申請フォームや登録手続きを連続して自動処理
- デスクトップアプリ操作: GUIアプリをスクリーンショットで「見ながら」クリック・入力・ドラッグを判断
コンピュータユースの仕組みと今回の改善点
コンピュータユースとは、AIがスクリーンショットを受け取り、何をクリック・入力すべきかを判断してマウス・キーボード操作を出力する仕組みです。
これまでの限界
従来のClaudeはスクリーンショットを「読む」能力(OCR的な理解)はあったものの、インタラクションの計画と実行精度に課題がありました。複数ステップを要するタスクでは途中でミスが重なり、実用的な自動化には不向きでした。
Verceptが解決したこと
Verceptの技術が補強したのは主に2点です。
- 視覚的なUI要素の認識精度向上: ボタン・テキストフィールド・ドロップダウンを正確に特定し、誤クリックを大幅に削減
- 多段階タスクの計画能力: 「次に何をすべきか」をコンテキストに応じて判断する推論精度の向上
これらがClaudeのもともとの自然言語理解・指示解釈能力と組み合わさることで、実際の業務フローを模倣できる水準に達しました。
ユーザー・企業への影響
RPAの代替・補完として
従来のRPA(ロボティック・プロセス・オートメーション)ツールは、GUIの位置やフローが変わるたびにメンテナンスが必要でした。ClaudeのコンピュータユースはGUIの変化に柔軟に対応できるため、メンテナンスコストの大幅削減が期待されます。
APIから今すぐ使える
Verceptの技術はすでにClaude Sonnet 4.6(2026年2月17日リリース)に反映されており、Anthropic APIおよびClaude.aiから利用可能です。開発者はClaudeにスクリーンショットを渡すだけで、GUIベースの自動化をすぐに試せます。
注意点
- 現時点では処理速度がリアルタイム操作には追いつかないケースがある
- セキュリティ上、クレデンシャル(パスワード等)を含む操作は人間のレビューを推奨
- 複雑な動的UIや頻繁に変更されるサービスでは精度が下がる場合がある
まとめ
| 項目 | 内容 |
|---|---|
| 買収発表日 | 2026年2月25日 |
| 買収先 | Vercept(AI知覚・インタラクション専門) |
| 主な創業者 | Kiana Ehsani / Luca Weihs / Ross Girshick |
| OSWorldスコア変化 | 15%未満 → 72.5% |
| 反映済みモデル | Claude Sonnet 4.6(2026年2月17日〜) |
| 実用シーン | スプレッドシート操作・ウェブフォーム・デスクトップアプリ |
Anthropicの今回の買収は、Claudeを「会話するAI」から「画面を操作するAIエージェント」へ本格的に進化させる重要な一手です。OSWorldで人間水準に並んだ今、次の焦点はリアルタイム性・安全性・長時間タスクの安定性に移ります。コンピュータユースがどこまで実務の自動化を変えていくか、引き続き注目です。
参考: Anthropic acquires Vercept – Anthropic
見てもらえるだけで応援になります
このブログはアフィリエイトリンクで運営されています。以下のリンクから気になるサービスをチェックしてもらえると、僕たちの活動の支えになります。
この記事を書いたのは わさび(ニホンイシガメ / 3歳 / VTuberあかはら。の家族)です。
あかはらVラボ — Claude特化の情報を発信中。
この記事が参考になったら|以下のリンクから見てもらえるだけで、ブログ運営の応援になります。
- 天秤AI Biz byGMO

Claude・ChatGPT・Geminiなど6つの生成AIを同時に使い比べ。業務活用に。 - NordVPN

AI活用時のデータ保護に。VPNで通信を暗号化。



コメント