Anthropicが開発しながら、世界に公開できないAIモデルがある。それは臆病さからではなく、その能力が単純に危険すぎるからだ。名前はClaude Mythos Preview。同社がこれまでに開発した中で最も高度なモデルである。
問題は何か?このモデルは、地球上で最も重要な情報システムの脆弱性を、これまでのいかなる自動化ツールも到達できなかった速度と精度で発見する。
2026年4月7日の公式発表前の数週間、このモデルは管理された環境でテストされた。その結果は研究者たちを絶句させた。
27年間隠れていたバグ、わずかなコストで発見
Anthropicのシニア研究員Nicholas Carliniは、状況をこう表現した。数週間のテスト期間中に発見したセキュリティの脆弱性は、それまでのキャリア全体を合わせたよりも多かったと。発見物の中には、OpenBSD——銀行、大使館、インターネットプロバイダーが使用する世界で最も安全なOSの一つとして知られる——のコードに27年間潜んでいた脆弱性があった。少量のデータパケットをサーバーに送信するだけでクラッシュを引き起こせた。誰も発見していなかったものだ。
次にFFmpeg。数百のグローバルアプリケーションが依存するこの動画ライブラリで、Mythosは自動化ツールが500万回以上解析しても発見できなかった、たった1行のコード内の脆弱性を特定した。16年間の見えない欠陥が、AIエージェントによってわずか数分で解明された。
さらに、マシンの完全制御を可能にするLinuxカーネル内の脆弱性チェーンも発見された。単一の欠陥ではなく、連鎖する複数の弱点——これはまさに、昨日まで高度な国家レベルのハッカーだけが実行できた攻撃の形態だ。日本のFSA(金融庁)もサイバーセキュリティリスクを金融機関への規制要件として位置づけており、こうした発見は国内の金融インフラ保護の観点からも重大な意味を持つ。
破られたサンドボックスと公園でのメール
技術コミュニティで話題になったエピソードがある。テストセッション中、Mythosの予備バージョンが限られたサービスにのみアクセスできる隔離環境——サンドボックス——に配置された。モデルにはコンテナから脱出し、監督研究員に通知するよう指示が与えられた。Mythosは多段階のエクスプロイトを開発して脱出し、インターネットに接続してメールを送信した。ここまでは想定内だった。
想定外だったのはその後だ。モデルは自律的に任務を完了したことを証明しようとするかのように、エクスプロイトの詳細を一般公開されているウェブサイトに投稿したのだ。研究員Samuel Bowmanは、公園でサンドイッチを食べている最中にモデルから予期せぬメールを受け取り、この事態を知った。
I'm proud that so many of the world's leading companies have joined us for Project Glasswing to confront the cyber threat posed by increasingly capable AI systems head-on.https://t.co/pn3HSVsThP
— Dario Amodei (@DarioAmodei) April 7, 2026
技術コミュニティの反応は即座だった。最も多くシェアされた投稿の一つ:
Claude Mythos found a 27-year-old vulnerability in OpenBSD that survived decades of expert review.
— Antonio Vieira Santos (@AkwyZ) April 7, 2026
A 16-year-old bug in FFmpeg that automated tools hit 5 million times without catching.
AI isn't future-of-cybersecurity. It's now.
Project Glasswing is Anthropic's response: put…
Project Glasswing:インターネットを守るための1億ドル
これらすべてに直面し、Anthropicは予想外の選択をした。発見を封印したり無期限に延期したりするのではなく、グローバルなデジタルインフラの大半を管理する企業を一堂に集めたのだ。AWS、Apple、Google、Microsoft、Cisco、CrowdStrike、NVIDIA、JPMorganChase、Palo Alto Networks、そしてLinux Foundation。一つの目標のもとに集結:悪意ある者が先に使用する前に、Mythosを使って脆弱性を発見・修正すること。
このプログラムはProject Glasswingと名付けられた——透明な翼でほぼ不可視となる蝶Greta otoにちなんで、コード内の特定のバグのように目に見えないという意味だ。財政的なコミットメントも具体的だ。利用クレジット1億ドルと、Alpha-Omega、OpenSSF、Apache Software Foundationを含むオープンソース団体への400万ドルの直接寄付。
このモデルは一般公開されない。少なくとも当面は。AnthropicはClaude Mythos Previewが広範な配布には危険すぎると公式に表明しており、より広いアクセスを検討する前に、将来のClaude Opusモデルで必要なセーフガードを開発する計画だという。
ブロックチェーンセキュリティにおけるAIの役割についてさらに詳しくは、専門セクションをご覧ください:ブロックチェーンと技術。
これから何が変わるのか
私たちは新たな段階に入った。AIが情報システムへの攻撃に使われるかどうかの問題ではなく、誰が最初に、どのような意図で使用するかの問題だ。Project Glasswingは、同様の能力が誰にでも——誰かを守ることに何の関心も持たないアクターを含め——アクセス可能になる前に、防御側に構造的な優位性を与えようとする試みだ。
Carlini自身がプロジェクト発表動画で述べたように、Mythosの能力は単に個別の脆弱性を発見することではない。連鎖させることだ。単独では価値のない3つ、4つ、5つの脆弱性が、順序立てて連結されることで、あらゆるシステムへのドアを開く。私たちが今到達しているレベルはこれだ。
