LLM

LLMランキング・モデル比較

スポンサーリンク

Gemini 3.1 ProがARC-AGI-2で77.1%、前作から2倍超のスコアが示す推論の跳躍

Googleが2月19日にGemini 3.1 Proをプレビューリリースした。「3.1」という表記は、フルバージョンアップではなく特定の能力に絞ったアップグレードを示している。実際、今回の強化は推論能力の向上に集中しており、その成果がベ...

オープンソースLLM勢力図【2026年2月】DeepSeek・Qwen・Llama・Mistralの最新状況

2026年2月、オープンソースLLM（大規模言語モデル）の世界は急速に変わっている。1年前まで「商用モデルには到底かなわない」と言われていた時代は終わり、OSSモデルがGPT-4oやClaude 3.5 Sonnetと同等か、場合によっては...

ローカルLLM完全ガイド【2026年版】自分のPCで動かせる最強モデルとセットアップ方法

📋 Claude Code コマンド指示書（クリックで展開） .claude/commands/ に保存して /コマンドで実行 --- description: "ローカルLLM完全ガイド【2026年版】自分のPCで動...

LLM API料金比較【2026年2月最新】Claude・GPT・Gemini・DeepSeekの単価一覧

LLM APIを選ぶとき、性能だけでなくコストは避けて通れない。同じタスクでも、モデル選択次第でAPI費用は10倍以上変わる。この記事では2026年2月時点の主要LLMの料金を数値で整理し、用途別の最適解を示す。結論：用途別おすすめ3行 ...

LLMベンチマークの読み方完全ガイド【2026年版】Arena Elo・SWE-bench・MMLUの意味と注意点

新しいLLMが発表されるたびに「SWE-benchでSOTA達成」「Arena Eloスコア1位」という文句が踊る。プレスリリースや技術ブログを読んでいると、数字の羅列に圧倒されがちだ。しかし、それらのスコアが実際の業務でどれだけ意味を持つ...

【2026年2月最新】今一番強いLLMはどれだ？カテゴリ別最強モデルランキング

2026年2月25日時点、各カテゴリで最強のLLMはこれです。結論: 今日の最強LLM カテゴリ最強モデルスコア/根拠総合 Gemini 3 Pro Arena Elo 1492（1位）コーディング Claude...

スポンサーリンク

タイトルとURLをコピーしました