AI・自動化Gemini 3.1 ProがARC-AGI-2で77.1%を達成——ClaudeもGPT-5も超えた
Google DeepMindのGemini 3.1 ProがARC-AGI-2ベンチマークで77.1%を記録。Claude Opus 4.6(68.8%)とGPT-5.3-Codex(52.9%)を大幅上回り、1世代での最大の推論性能向上を達成。
AI・自動化
AI・自動化
AI・自動化
AI・自動化
AI・自動化
AI・自動化
AI・自動化
AI・自動化
AI・自動化
AI・自動化