他力code
ブログ一覧に戻る

Anthropic「Claude Mythos」誤リーク:史上最強サイバー能力でAI安全保障に激震、株式市場も動揺

2026年3月26日、AI安全研究企業Anthropicが開発中の次世代モデル「Claude Mythos」(別バージョンでは Capybara 名義)の詳細情報が、誤って公開されたデータストアを通じてインターネット上に流出した。Anthropicは存在を認め「これまで構築した中で最も優れたモデルだ」と述べる一方、その突出したサイバー攻撃能力をめぐる警告も合わせて流出し、市場と安全保障コミュニティに大きな衝撃を与えた。


漏洩の経緯

公開ブログ用アセットから3,000件超が露出

Fortune誌の報道によれば、Anthropicのブログシステムに紐づく暗号化されていない公開検索可能なデータストアに、未公開の下書きアナウンスや内部コンテンツを含む約3,000件のアセットが保存されていた。その中に、Claude Mythosの発表に向けて準備されていた複数バージョンのブログ投稿が含まれており、これがリサーチャーによって発見・共有された。

発見者はAIセキュリティ研究者のRoy Paz氏(LayerX Security、シニアAIセキュリティリサーチャー)とAlexandre Pauwels氏(ケンブリッジ大学)の2名だ。

モデル名は2つ存在

流出したドキュメントには、同一内容でモデル名だけが異なる2つのバージョンが確認された:

  • バージョン1:モデル名「Mythos
  • バージョン2:モデル名「Capybara

この二重命名は、どちらが正式名でどちらが別称かを現時点では確定できないが、Anthropicが複数の名称候補を並行して検討していたことを示唆する。Anthropicの広報担当者はその後、モデルの存在を公式に認め、「段階的に早期アクセス顧客へ提供する予定」と述べた。


Claude Mythosの能力:「ステップチェンジ」とは何か

前モデル比で「劇的に高いスコア」

流出した内部ドキュメントには次の記述がある:

「Claude Opus 4.6と比較して、Capybaraはソフトウェアコーディング、学術的推論、サイバーセキュリティなど複数のテストで劇的に高いスコアを記録している。」

具体的なベンチマーク数値は現時点で流出していないが、Anthropicの公式コメントは「ステップチェンジ(段階的飛躍)」という表現を使っており、単なる漸進的改善ではなく能力の質的転換を主張している。

能力の6つの柱(流出情報より)

能力カテゴリ 内容
ソフトウェアコーディング 前世代比で大幅なスコア向上
学術的推論 複雑な数学・科学問題への対応力
サイバーセキュリティ 現存するいかなるAIモデルよりも突出
長文コンテキスト 大規模ドキュメントの分析・統合
指示追従 複雑な複数ステップ指示への精度
コード脆弱性検出 ゼロデイ級の脆弱性探索・悪用可能性を強く示唆

最大の懸念:前例のないサイバー攻撃能力

「防御の速度を遥かに超える」

今回の流出で最も注目を集めたのは、Anthropic自身がモデルのリスクを認識した内部警告文だ:

「本モデルのサイバー能力は現在、他のいかなるAIモデルよりも突出している。これはソフトウェア脆弱性を、防御側の対応速度を遥かに超える速さで発見・悪用できるモデルの波の先駆けとなる。」

この記述は、サイバーセキュリティコミュニティに即座に衝撃を与えた。AIが既知の脆弱性データベースを検索する現在の水準から、ゼロデイ級の脆弱性探索と悪用可能性へと移行しつつある可能性を強く示唆するからだ。

株式市場への影響

この懸念は金融市場にも即座に波及した。3月27日、主要なサイバーセキュリティ企業の株価が軒並み下落した。

企業・指数 株価変動
CrowdStrike (CRWD) -7%
Palo Alto Networks (PANW) -6%
Zscaler (ZS) -4.5%
Okta -3%
SentinelOne -3%
Fortinet -3%
iShares Tech-Software ETF (IGV) 約-3%

暗号資産市場も連動した。Bitcoinは一時66,000ドルまで下落(24時間で約-4%)、Ethereumも4%超の下落を記録し、暗号資産市場全体の時価総額は2.36兆ドルまで後退した(CoinDesk報道)。


Anthropicの対応と段階的リリース計画

「リスクを理解してから展開する」

Anthropicは流出確認後、次のようなコメントを発表した:

「自社テストで学んだことを超えて、このモデルがもたらすリスクを理解したい。特にサイバーセキュリティ領域での近未来リスクを把握することを最優先に置く。」

早期アクセスの仕組み

リリース計画は以下の段階を想定:

  1. 第1フェーズ:サイバーセキュリティアプリケーションの評価を専門とする小規模な早期アクセス顧客グループへの提供
  2. 第2フェーズ:Claude APIを通じた段階的な一般提供拡大
  3. 第3フェーズ:評価・モニタリング結果を踏まえた正式公開

この「責任あるスケーリング」アプローチは、Anthropicが以前から掲げているASL(AI Safety Level)フレームワークに沿ったものだ。


業界への影響と論点

AI安全研究の「ジレンマ」

今回の漏洩は、AIサイバー能力研究における根本的なジレンマを浮き彫りにした:

  • 研究の必要性:AIのサイバー悪用リスクを理解するには、実際にその能力を持つモデルを開発・評価する必要がある
  • リスクの実在:評価過程でモデルが漏洩・悪用された場合、その能力そのものが攻撃ツールになる
  • 透明性の問題:リスクを開示すれば市場と攻撃者の両方に情報が渡る

White House AI政策フレームワークとの関係

漏洩の6日前にあたる3月20日、トランプ政権は「AI国家政策フレームワーク」を公表していた。同フレームワークは米国の競争力とイノベーション促進を重視する内容であり、Claude Mythosのような高能力モデルの開発を原則的に支持する方向性を持つ。しかし今回の漏洩は、そのような政策と「前例のないサイバーリスク」の間の緊張をあらためて顕在化させた。

競合他社への影響

企業 想定される対応
OpenAI GPT-5.xシリーズのサイバー評価強化の可能性
Google DeepMind Gemini 3.1のサイバー能力ベンチマーク開示圧力
Meta Llama 4オープンソース路線への安全性懸念
防衛・政府機関 調達基準へのサイバー評価要件追加

まとめ

  • Anthropicが次世代モデル「Claude Mythos(別バージョンでは Capybara 名義)」の存在を、非公開データストアの誤公開により意図せず漏洩(2026年3月26日)
  • 内部文書は「現存するいかなるAIモデルよりもサイバー能力が突出」と警告し、ゼロデイ級の脆弱性探索・悪用可能性を強く示唆
  • コーディング・学術推論・サイバーセキュリティで前モデル(Claude Opus 4.6)を「劇的に上回る」とされるが、具体的な数値は未公表
  • サイバーセキュリティ株が急落し、AI脅威の高度化で既存防御の優位が揺らぐ可能性への投資家懸念が市場全体に波及した
  • Anthropicはリスク評価を優先した段階的リリース計画を継続する方針

Claude Mythosが正式公開されるまでの間、AI安全性・サイバーセキュリティ・規制政策の三者が交差するこの問題は、今後数週間の最重要論点であり続けるだろう。


情報ソース: