全47件の記事
Anthropicが4月16日にClaude Opus 4.7の一般提供を開始。SWE-bench Proで64.3%を記録し、GPT-5.4とGemini 3.1 Proを抑えて同ベンチマークで首位に立った。
Meta Superintelligence Labsが2026年4月8日に「Muse Spark」を発表。frontier級主力モデルとして初の非オープンウェイトとしてHealthBench Hard 42.8でGPT-5.4(40.1)を上回る医療AI最強スコアを達成。思考圧縮技術でLlama 4比10倍の計算効率を実現。
Googleが2026年4月2日にGemma 4をApache 2.0ライセンスで公開。31BモデルはAIME 2026で89.2%を達成し自身の20倍のサイズのモデルを凌駕。MoE設計で3.8B有効パラメータながらArena AIオープンモデル6位を誇る革命的な小型LLM。
Anthropicが次世代モデル「Claude Mythos(Capybara)」の存在を非公開データストアの誤公開で漏洩。「どのAIモデルよりもサイバー能力が突出」と内部文書が警告。サイバーセキュリティ株が急落し、業界に衝撃が走った。
オープンソースAIエージェントOpenClawがGitHub 250,000スター超え。Jensen Huang が「AIのOS」と表現した一方、CVE-2026-25253や800件超の悪意スキルなどセキュリティ危機も深刻化。NVIDIAがGTC 2026でNemoClawを発表。
Xiaomiが1兆パラメータのMiMo-V2-ProをOpenRouterに掲載。ClawEval 61.5でClaude Opus 4.6(66.3)に肉薄しGPT-5.2(50.0)を超える性能をGPT-5.2の約15%のコストで実現。提携フレームワーク経由で1週間の無料API提供も。
同一データを自律型AIアナリストに分析させると、ペルソナ設定だけで「仮説支持率」が最大66ポイント変動することをAmazon AWSとCMUの研究チームが大規模実験で実証した論文を解説。
自律兵器・大量監視へのClaude使用を拒否したAnthropicが、ペンタゴンの「サプライチェーンリスク」指定に対し提訴。OpenAI・Google社員30名超が支持声明を発表した歴史的対決。
OpenAIが3月5日にGPT-5.4を発表。OSWorld-Verifiedで75%を記録しComputer Use機能を初搭載。ChatGPT for Excelベータ開始・Google Sheets対応予定など金融業務AIが新次元へ突入した。
Google DeepMindが2026年2月19日にリリースしたGemini 3.1 Proは、ARC-AGI-2で77.1%を達成し前世代比2.5倍の推論向上を実現。Claude Opus 4.6(68.8%)を大きく超え、価格は7倍安い。
AnthropicのShen・Tamkinによる実験的研究。52名の開発者を対象としたRCTで、AIアシスタントを使用したグループの学習テストスコアが17%(Cohen's d=0.738)低下すると判明。高スコアグループと低スコアグループでAIの使い方に大きな差が見られた。
86か国・2国際機関がニューデリー宣言を採択、Google最大$150億規模計画・OpenAI×Tata参入。2035年GDP+$6000億予測、小学3年AI必修化など、インドの今後10年の教育・ビジネス変革を考察。