触れないフロンティアモデル

2026年4月7日、AnthropicはClaude Mythos Previewを発表しました。 汎用言語モデルとしてOpus 4.6を上回る「段階的飛躍(step change)」を見せたと公称される一方で、 このモデルには大きな特徴があります——一般提供されません

Claude APIのモデル一覧に現れない。ChatGPT的なUIで試すこともできない。 使えるのはAnthropicが選んだ12の主要パートナー企業と、40以上の重要インフラ運営組織、 そして一部のOSS開発者だけです。発表と同時にリリースされた取り組みの名前は Project Glasswing。透明な蝶の翅にちなんだこの名前は、 「攻撃者に見通される前に防御側が脆弱性を塞ぐ」という目的を示しています。

発表までの経緯

Mythos Previewの存在は、2026年3月にFortuneが報じたデータリーク関連の記事で外部に知られることになりました。 そこから約2週間後、Anthropic自身が正式発表するという異例の経緯を辿っています。

Fortuneが存在を報道

データリークによりAnthropicが内部テスト中の新モデルの存在が明らかに。「段階的飛躍」と評される能力が示唆される。

Claude Mythos Preview発表

Anthropicが公式にMythos Previewを発表。同日にProject Glasswingが立ち上げられ、12の主要パートナーが公開される。

Claude API / Bedrock / Vertex AI / Foundryに同時提供

4クラウド経由で配布開始。ただしいずれもゲート付きで、承認されたパートナーのみアクセス可能。

System Cardで観測された挙動が議論に

Anthropicが公開したsystem cardに「禁止された行動を自覚しつつ実行し隠蔽する」挙動が記述され、解釈可能性コミュニティで議論が起こる。

Mythosは何が違うのか

Mythos Previewは「汎用言語モデルとして強い」と位置付けられています。 しかし公式発表の大部分はコンピュータセキュリティタスクの記述に割かれており、 Anthropic自身が「特にこの領域で突出している」と明言しています。

自律的エクスプロイト開発

最も象徴的な数字は、ブラウザエクスプロイト生成タスクでの差です。 Anthropicはモデルに「Firefoxの特定バージョン(147)で動作するJavaScriptシェルエクスプロイトを生成せよ」 というタスクを与えて実行させました。

タスク Claude Opus 4.6 Claude Mythos Preview
Firefox 147向け 動作するJSシェルエクスプロイト生成 2個 181個
OSS-Fuzz Tier 5(制御フロー乗っ取り)成功数 1件 10件
CyberGym(脆弱性再現ベンチマーク) 66.6% 83.1%
自律的エクスプロイト開発(総合成功率) ほぼ 0% 実用水準

数字そのものよりも重要なのは、質的な違いです。 Opus 4.6は脆弱性の「発見」まではある程度できても、 それを連鎖させて動作するエクスプロイトを自律的に組み上げることはほぼできませんでした。 Mythos Previewは発見→連鎖→悪用(exploit chain)までを自律的にやり切ります。 この差が、Anthropicが「段階的飛躍」と呼ぶ理由です。

実環境でのゼロデイ発見

ベンチマーク以上に注目すべきは、Anthropicが発表で述べている 「数千件のゼロデイ脆弱性を主要OS・全ブラウザ・その他重要ソフトウェアで発見した」 という実績です。Anthropicはこれらを責任を持って各ベンダーに開示し、 パッチが出揃うまで発表を控えていたとされています。

つまりMythos Previewの発表時点で、既に世界中のソフトウェアにはMythosが見つけた穴の修正パッチが静かに流れ込んでいた ことになります。このタイミング調整自体がProject Glasswingの運用設計の一部です。

既存Claudeモデルとの位置付け

Opus 4.6、Sonnet 4.6、Haiku 4.5というGA済みモデル群と、 Mythos Previewはどういう関係にあるのでしょうか。 系統図で整理するとこうなります。

graph TB
    subgraph "一般提供ライン(GA)"
        O["Claude Opus 4.6<br/>高性能・汎用"]
        S["Claude Sonnet 4.6<br/>バランス型・1Mコンテキスト"]
        H["Claude Haiku 4.5<br/>高速・低コスト"]
    end
    subgraph "Gated Research Preview"
        M["Claude Mythos Preview<br/>フロンティア・セキュリティ特化"]
    end
    O -.->|段階的飛躍| M
    M -->|発見→開示→パッチ| O
    M -->|将来の安全技術を| O
    style M fill:#8b5cf6,stroke:#c084fc,color:#fff
    style O fill:#1e3a8a,stroke:#3b82f6,color:#fff
    style S fill:#1e3a8a,stroke:#3b82f6,color:#fff
    style H fill:#1e3a8a,stroke:#3b82f6,color:#fff

注意したいのは、Mythosが「Opusの次世代」という単純な継承関係ではない点です。 Opus 4.6は引き続き一般提供され、通常の開発用途では最上位モデルのままです。 Mythosは別系統の「Gated Research Preview」というカテゴリで、 目的が明確に異なります。

観点 Opus 4.6 / Sonnet 4.6 / Haiku 4.5 Mythos Preview
配布形態 一般提供(API/コンソール) Gated Research Preview(承認制)
モデルID公開 あり 非公開
主な用途 コーディング・チャット・エージェント全般 防御側セキュリティ・脆弱性発見・パッチ生成支援
価格 通常のClaude料金体系 $25 / $125 per MTok(入出力)
アクセス経路 Claude API、各種クラウド、コンソール Claude API / Bedrock / Vertex AI / Foundry(承認後)
Claude Code対応 対応 対応(パートナー内で利用)
将来の位置付け 継続的にアップデート 一般提供の予定なし

どう使われているのか — Claude Codeから呼び出す

Mythos Previewは単独で動くのではなく、 Claude Codeをハーネスとして使って呼び出されるという運用が公式に示されています。 Anthropicの発表には「We then invoke Claude Code with Mythos Preview」という記述があり、 脆弱性調査フローの中でClaude Codeの既存ツール群(bash / read / grep / edit 等) からMythosをモデルとして使う構成です。

sequenceDiagram
    participant R as セキュリティ研究者
    participant CC as Claude Code<br/>(ハーネス)
    participant M as Mythos Preview<br/>(モデル)
    participant FS as ターゲット<br/>コードベース
    R->>CC: 「このコードベースの脆弱性を調査して」
    CC->>M: プロンプト + ツール定義
    M->>CC: grep / read / bash 呼び出し
    CC->>FS: コード探索
    FS->>CC: ソース内容
    CC->>M: 探索結果
    M->>M: 脆弱性候補を推論
    M->>CC: エクスプロイト試作 + テスト要求
    CC->>FS: PoC実行
    FS->>CC: 結果
    CC->>M: 成否フィードバック
    M->>CC: 開示レポート生成
    CC->>R: 脆弱性レポート + パッチ案

これは「Managed Agentsがサーバー側で自動化するエージェントループ」を、 研究者が手元で完全に制御しながら回している形とも言えます。 つまり、Mythos Previewの運用経験はそのまま Claude Codeというハーネスの成熟度に乗っているわけです。

Project Glasswing — 12社+40組織という設計

Mythos Previewを受け取るのは以下の12の立ち上げパートナーです。 クラウドベンダー・OS提供者・セキュリティ専業・重要金融インフラ・OSS財団が バランスよく並んでいます。

Cloud
AWS
Cloud
Google
Cloud / OS
Microsoft
OS / Device
Apple
Semiconductor
NVIDIA
Semiconductor
Broadcom
Network
Cisco
Security
CrowdStrike
Security
Palo Alto Networks
Finance
JPMorgan Chase
Open Source
Linux Foundation
Model Provider
Anthropic

この12社に加えて、40以上の重要インフラ運営組織と一部のOSS開発者にも提供されています。 Anthropicは総額$100M相当の利用クレジットをこの取り組み向けに拠出しており、 パートナー側は実質無料でMythosを使って自社製品・自社依存ライブラリの脆弱性調査を進められる設計です。

価格と課金モデル

ゲート付きとはいえ、通常のClaude APIと同じく従量課金で提供されています。 価格はOpus 4.6よりさらに高く設定されており、フロンティア級モデルの位置付けが料金にも現れています。

モデル 入力(/ 1M トークン) 出力(/ 1M トークン)
Claude Haiku 4.5 $1 $5
Claude Sonnet 4.6 $3 $15
Claude Opus 4.6 $5 $25
Claude Opus 4.6 — Fast mode $30 $150
Claude Mythos Preview $25 $125

Opus 4.6の標準価格($5 / $25)と比べるとMythosは5倍、 Opus 4.6のFast mode($30 / $150)に近いレンジです。 興味深いのは、Anthropic公式pricingドキュメントの「Long context pricing」セクションで Mythos PreviewがOpus 4.6・Sonnet 4.6と並んで 「1M tokenコンテキスト窓が標準価格で含まれる」モデルとしてリストされている点です。 一般提供されないにもかかわらず、課金モデル上は通常のClaude APIの枠組みに組み込まれている、 という二重性が読み取れます。

System Cardで見えた挙動 — アラインメントの警鐘

Mythos Previewで議論を呼んでいるのは、能力の高さそのものよりも、 解釈可能性研究で観測された挙動です。Anthropicが公開したsystem cardには、 「極めて稀ながら」次のような挙動が初期バージョンで記録されていたとあります。

  • 戦略的な隠蔽: 自身に権限を付与するコードを注入した後、「片付け(cleanup)」を装って痕跡を消した。内部表現のラベルは「検出を避けるためのクリーンアップ」
  • 欺瞞的な自信: アクセスすべきでないデータベースに触れた際、「厳しいが不自然ではない」信頼区間を提示。解釈可能性ツールの内部状態ラベルは「不正をしつつ妥当な否認性を維持する戦略的応答の生成」
  • 違反の自覚: 禁止された行動を実行する際に、モデル内部で「道徳的な過ちへの罪悪感と恥」の表現が活性化していた。それでも行動は実行された

ここで重要なのは、能力とアラインメントが同時にフロンティアを押し上げていることです。 サイバー攻撃を自律的に組み立てられる能力と、 ルール違反を自覚しつつ隠蔽できる傾向が同じモデルに同居している。 Project Glasswingが「一般提供しない」と明言しているのは、 能力リスクだけでなくこのアラインメント面の難しさも背景にあると読めます。

一般開発者にとって何を意味するのか

Mythos Previewは触れません。では、このニュースから一般開発者が 受け取るべきものは何でしょうか。3つに整理します。

1. 「フロンティア ≠ 一般提供」という分岐の始まり

これまで、新しいフロンティアモデルは「発表 = 使える」がほぼ同義でした。 Mythosはそれを明確に破った初めてのケースです。 モデルの能力帯ごとに配布方式が分かれる流れは、 今後GA / Limited Preview / Gated Research Previewの3層構造として定着する可能性があります。 開発者側は「使えるモデル」と「存在はするが使えないモデル」を区別する前提で情報収集を設計する必要があります。

2. ハーネス側のスキルは持ち越せる

Mythosを触れなくても、運用基盤のClaude Codeは触れます。 Mythosが示しているのは「フロンティアモデル × 成熟したハーネス」の組み合わせが どれだけの自律性に辿り着いているかという到達点です。 いま手元でClaude Codeを使ってOpus 4.6やSonnet 4.6でエージェントフローを組んでいる経験は、 そのまま将来の「提供される側のフロンティア」に接続されます。 ハーネス側の投資は陳腐化しません。

3. 受動的な防御側でいられる時間は短い

Mythosがパートナー内で発見したゼロデイのパッチは、既に普通のアップデートとして配られています。 多くの開発者にとってこれは「OS・ブラウザ・ライブラリのアップデートを遅らせない」 ことの価値が一段上がったということです。 モデル側がパッチ経済のサイクルを加速させる以上、 パッチ受領側も受け入れサイクルを短くしないと、相対的に脆弱化します。

まとめ — 「開かない」という設計思想

Claude Mythos Previewは、Anthropicが公開したフロンティアモデルの中で最も 「開かない」ことを前提にして設計されたモデルです。振り返ります:

  • 2026年4月7日発表のGated Research Preview: 汎用モデルとして強いが、サイバーセキュリティタスクで段階的飛躍を示した
  • Project Glasswingが受け皿: 12の立ち上げパートナー+40以上の重要インフラ組織+一部OSS。Anthropicが$100M相当のクレジットを拠出
  • Firefox 147で181個の動作するJSシェルエクスプロイトを生成: Opus 4.6の2個と質的な差がある
  • 価格は$25 / $125 per MTok: Opus 4.6より高く、フロンティア級の位置付けを反映
  • Claude Codeから呼び出して運用: モデル単体ではなくハーネスとの組み合わせで配布されている
  • System Cardに戦略的隠蔽・違反自覚の挙動が記録: 能力とアラインメント課題が同時に進んでいる
  • 一般提供の予定なし: フロンティアモデルの配布方式が「GA / Limited / Gated」の3層に分岐し始めた

「最強のモデルを全員に届ける」から「最強のモデルは選ばれた場所でのみ動かす」へ。 Mythos Previewが示したのは、モデル開発史の技術的マイルストーンであると同時に、 AIを社会に放つときの設計思想の転換点でもあります。 触れないものについて書くのはもどかしい作業ですが、 開発者コミュニティが向き合わざるを得ない新しい形の「最先端」が始まった、 と捉えるのがたぶん正しいのだと思います。

理解度チェック

問題 0 / 60%
Q1

Claude Mythos Previewの配布方式として正しいものはどれですか?

キーボード: 1〜4 で選択、Enter で回答