「Claude Mythos」の性能は本物か？　英研究機関が検証結果を公表／Mythosはサイバーセキュリティの「AlphaGoモーメント」か

	2026/04/15

＜＜Amazonギフトカードあたる！＞＞ITmedia AI＋読者調査
アイティメディア株式会社

	「Claude Mythos」の性能は本物か？　英研究機関が検証結果を公表

	「Claude Cowork」一般提供開始　全社導入を支える管理機能も

	米財務長官とFRB議長が銀行幹部に警告　Anthropicの最新AI巡り、サイバーセキュリティに懸念

	Claudeを“コスパ良く”利用可能に　性能の異なるモデルが“適材適所”で稼働、Anthropicの新ツール

	AIコーディング支援「Devin」開発元、日本法人設立　アジア初の拠点に

	「AIはあくまで補助」――朝日新聞、「社長『AI全振り』宣言」との日経記事巡り声明

	28年までに生成AIアプリの4分の1にセキュリティ事故、MCP普及でリスク拡大――Gartner予測

	OpenAI、月額100ドルのProプラン追加　Codexの利用枠に選択肢

	「Claude Code」全社員に義務づけたら……コーディング経験ゼロの86％がデプロイ達成　グッドパッチが成果を公開

	さくらインターネット、約38億円の「AI向け案件」受注　国立機関から

	SB Intuitions、自律的にTシャツを畳めるロボアーム　1枚約40秒で完了

	国産AI開発「取り組みは重要」小野田紀美担当相　ソフト・NEC・ホンダ・ソニー連合

Claude Mythosはサイバーセキュリティの「AlphaGoモーメント」か

米Anthropicが発表した最新AI「Claude Mythos」。現在のところ、一般公開はせずに限られたパートナーのみへの限定公開となっている。その理由は、サイバー攻撃性能が非常に高いからだ。

Anthropic自身の報告でもMythosがゼロデイ攻撃を自律的に開発していたとあった他、第三者機関として英国政府の研究機関AISIが検証したところでも、人間の専門家が20時間かけて行う想定のサイバー攻撃シミュレーションを10回中3回完遂。検証結果を受けてAISIは「ネットワークへのアクセス権が取得された小規模で防御が脆弱なエンタープライズシステムに自律的に攻撃する能力がある」と評価した。

こうした性能は攻撃にも防御にも使える。あらかじめ自社のシステムに攻撃をかけて脆弱性を洗い出す方法を「ペネトレーションテスト」などと呼ぶが、ある意味最強のペネトレーションテストに使えそうだ。そしてそれを自社ではなく他社に向ければもちろんサイバー攻撃となる。

Anthropicが悪を成さなければ／ユーザーが悪を成さないように出力を制御すれば問題ないのではないか、とも思えるが、なかなかそう楽観的にもなれない。なぜなら、現在オープンウェイトモデルが勢いよく発展しており、AnthropicやOpenAIのフロンティアモデルに近づくほどの性能を見せ始めているからだ。

Anthropicが単なるスケーリング則ではない学習方法によってMythosを生み出したならば、他社はそれに簡単には追随できないかもしれない。だがいわゆる“シンギュラリティ”とも言える、「AIでAIを高速に自律開発する」段階にはまだ至っていないと同社は申告している。それならば、他社も時間の問題で追いつく可能性がある。

オープンウェイトモデルだから誰でも使えて即危険というわけではないのだが、ここで注目したいのが「abliteration」という技術。オープンウェイトモデルでも、例えばエロティックな表現、違法行為をそそのかす表現、開発国によっては好ましくない特定の表現などを出力しないようにそうした出力を“拒否させる”、というチューニングが開発ベンダーによって普通に行われている。abliterationはこの「回答拒否」を取り除く技術で、現在のホットなオープンウェイトモデルでは第三者によってabliteratedモデルがしばしば公開されている。

つまり、これからさらに高性能になっていくであろうオープンウェイトモデルについて、開発ベンダーが「違法なことには使われないように」とチューニングしたとしても、すでにそれをバイパスする技術がある以上は、違法なことへの投入もユーザーの意思次第で可能ということだ。

現在においてもLLMを使ったサイバー攻撃はあるが、悲観的に見るならば、Mythosレベルのゼロデイ攻撃が当たり前になる世界が来るまで時間の問題、ということになる。

ユーザー企業として今できることは、Mythosを検証した英AISIが指摘したように、まずはサイバーセキュリティの基本を抑えること。つまりセキュリティアップデートの定期適用、堅牢なアクセス制御、適切なセキュリティ設定、包括的なログ記録──といったことだ。基本を抑えられていない企業からやられていくため、基本をしっかり抑えるだけでも短期的にはしのげるはずだ。

ただその先は分からない。Mythosなどを使って先回りして脆弱性を潰すような防御ソリューションが出るのかもしれない。もしくは、考えにくいが一定性能以上のAIは公開されなくなるのかもしれない。Mythosはサイバーセキュリティにおける「AlphaGoモーメント」であるように個人的には感じられる。実社会に極めて重要な分野で、人類の知らない世界が幕を開けつつある。（井上）