2026年4月8日、MetaはAI業界を震撼させる新モデル「Muse Spark」を発表した。Meta Superintelligence Labs(MSL)が9ヶ月をかけてゼロから再構築したこのモデルは、Metaのfrontier級主力モデルとして初めて非オープンウェイトという歴史的転換点を意味する。Llama路線で培ったオープンウェイト戦略から脱却し、GPT-5.4・Gemini 3.1 Proと真正面から戦う姿勢を鮮明にした。
Metaが「本気」を示した背景
Scale AI創業者を招いた143億ドルの賭け
Muse Sparkの開発を率いたのは、Alexandr Wang──Scale AI創業者として知られる若きAIエンジニアだ。2025年後半、MetaはWangを迎え入れるために約143億ドル($14.3B)規模の取引を行い、従来のLlamaチームを刷新してMeta Superintelligence Labsを新設した。
過去9ヶ月でMSLがAIスタックを土台から再構築した成果が、今回のMuse Sparkである。
なぜ今、オープンソースをやめたのか
Metaはこれまで、Llamaシリーズをオープンウェイトで公開することで開発者コミュニティに支持され、AI業界での存在感を確立してきた。しかし今回のMuse Sparkはオープンウェイトではない。この戦略転換について、MetaはOpenAI・Anthropicが独占してきた「フロンティアモデル」市場への本格参入を示すものだと説明している。
Muse Spark の技術的特徴
マルチモーダル入力対応
Muse Sparkは音声・テキスト・画像の入力に対応するマルチモーダルモデルだ。現時点では出力はテキスト中心で、Meta AIアプリおよびmeta.aiから利用できる。
「Contemplating(熟考)」モード
Muse Sparkには2つの動作モードがある:
- 高速モード:日常的なクエリへの素早いレスポンス
- Contemplatingモード:複数のサブエージェントを並列で動かし、段階的な推論を行う「熟考」モード
このContemplatingモードが、医療や科学分野での高精度回答を実現している。
高いトークン効率
Muse Sparkは推論時のトークン消費が少なく、トークン効率の高さが特徴として挙げられている。Artificial Analysisの評価によれば、Intelligence Index評価でのMuse Sparkの出力トークン数はGemini 3.1 Pro(5,700万)と同水準で、Claude Opus 4.6(1億5,700万)やGPT-5.4(1億2,000万)と比べて大幅に少ない。
| モデル | Intelligence Index評価での出力トークン数 |
|---|---|
| Claude Opus 4.6 | 1億5,700万トークン |
| GPT-5.4 | 1億2,000万トークン |
| Gemini 3.1 Pro | 5,700万トークン |
| Muse Spark | 5,800万トークン |
ベンチマーク:得意分野と弱点
総合ランキング
Artificial Analysis Intelligence Index v4.0(2026年4月時点)での総合スコア:
| モデル | スコア |
|---|---|
| Gemini 3.1 Pro | 57 |
| GPT-5.4 | 57 |
| Claude Opus 4.6 | 53 |
| Muse Spark | 52 |
HealthBench Hard:医療AIで圧倒的1位
Muse Sparkが最も際立つ強みを発揮したのがHealthBench Hard──1,000件のオープンエンド医療クエリからなる難関ベンチマークだ。
| モデル | HealthBench Hard スコア |
|---|---|
| Muse Spark | 42.8 🥇 |
| GPT-5.4 | 40.1 |
| Gemini 3.1 Pro | 20.6 |
| Grok 4.2 | 20.3 |
| Claude Opus 4.6 Max | 14.8 |
Gemini 3.1 Proの2倍超、Claude Opus 4.6の約3倍というスコアは衝撃的だ。Metaは医師チームと協力してトレーニングデータをキュレーションしており、医療分野への本気度が数字に表れている。
弱点:抽象推論とコーディング
一方、苦手分野も明確だ。Artificial Analysisの評価によれば、エージェント的パフォーマンスは他のフロンティアモデルと比べて突出しておらず、コーディングベンチマーク(TerminalBench Hard)でもClaude Sonnet 4.6・GPT-5.4・Gemini 3.1 Proに劣後している。抽象推論やコーディングでは、現時点で他の最上位モデルに見劣りする側面がある。
利用方法と価格
現在のアクセス手段
Muse Sparkは現時点では無料で利用できる(ただし将来的なレート制限の可能性をMetaは否定していない):
- Meta AIアプリ(iOS/Android)
- meta.ai(ウェブブラウザ)
- 数週間以内にFacebook・Instagram・WhatsApp・Messengerへ展開予定
4月8日時点ではまず米国で提供を開始しており、他地域への拡大も予告されている。
API:一般公開は未提供、選定パートナーにはprivate preview
一般向けAPIは現時点で未提供だが、Metaは選定パートナー向けにprivate previewでAPIアクセスを提供している。一般公開の価格や時期は明かされていない。競合との価格比較:
| モデル | 入力(per 1M tokens) | 出力(per 1M tokens) |
|---|---|---|
| Muse Spark | 未定(現時点では無料) | 未定(現時点では無料) |
| Gemini 3.1 Pro | $2.00 | $12.00 |
| GPT-5.4 | $2.50 | $20.00 |
| Claude Opus 4.6 | $5.00 | $25.00 |
業界への影響
AI競争の構図が変わる
これまでのAI競争は「OpenAI vs Anthropic vs Google」の三つ巴だった。Metaはオープンソース路線でその外側に位置していたが、Muse Sparkの登場でその構図が崩れた。
35億人規模のユーザーを抱えるFacebook・Instagram・WhatsAppへの展開が始まれば、Muse Sparkは一夜にして世界最大規模のAIデプロイメントになり得る。
医療AI市場へのインパクト
HealthBench Hardでの圧倒的1位は、医療業界に対するMetaの明確なシグナルだ。電子カルテ、医師向け診断支援、患者向け健康情報サービスなど、医療AIの主要な応用領域でMuse Sparkが競合を大幅に上回る性能を示した意味は大きい。
まとめ
- Metaがfrontier級主力モデルとして初めて非オープンウェイトのMuse Sparkを4月8日に発表、Llama路線から脱却
- HealthBench Hard 42.8でGPT-5.4(40.1)を上回り、医療AI最強モデルの座を獲得
- 「Contemplatingモード」(並列サブエージェント推論)と高いトークン効率が技術的特徴
- 総合ベンチマークでは上位グループ(スコア52)でGemini 3.1 Pro・GPT-5.4・Claude Opus 4.6に次ぐ水準。抽象推論とコーディングは相対的に弱く、現時点での課題
- 4月8日時点で米国から提供開始・他地域拡大も予告。一般向けAPI未提供(選定パートナー向けprivate previewは提供中)。Metaの35億人規模ユーザー基盤への展開が始まれば市場構造が一変する可能性
情報ソース: