UK AI Security Institute: Frontier Models Have Broken All Prior Trend Lines for Autonomous Cyber Capability

何が起きたか

英国AI Security Institute (AISI) は、英国政府に代わって展開前評価を実施し、2026年5月13日に、AnthropicのClaude Mythos PreviewとOpenAIのGPT-5.5が自律型サイバータスク完了に関する過去のすべての予測トレンドを大幅に上回ったことを示す独立研究を発表した。AISIは以前、Frontier Modelsの80%信頼度サイバータイム地平が約5ヶ月ごとに倍増していると推定していた (2025年11月の8ヶ月倍増から低下)。Mythos PreviewとGPT-5.5は現在、測定されたすべてのトレンドラインを上回った: MythosはAISIサイバーレンジの両方を完了した最初のモデルとなり ('The Last Ones'の32ステップ攻撃を6回中6回成功させ、'Cooling Tower' (以前は未解決) を3回中3回完了させた)。METRからの独立研究は、2024年後期以降の約4ヶ月の倍増時間を確認した。

なぜ重要か

AISIレポートは、Frontier AI能力が過去のモデルが予測したよりも速く加速していることを定量的に、政府による裏付けで示す。5ヶ月から4ヶ月の倍増への移行 (およびClaude MythosとGPT-5.5の両方のサイバーレンジでのパフォーマンス向上) は、能力スケーリングの非連続性を示している。これは、Palo Altoおよび議会議員が引用している3～5ヶ月のウィンドウを直接裏付ける: 自律型サイバータスクの複雑さが4～5ヶ月ごとに倍増している場合、組織は現世代モデルが多段階攻撃を自律的に実行できるようになる前に、防御を強化するための約1つの倍増サイクルを持つ。AISIはより要求の厳しい評価 (新しいサイバーレンジ、積極的なサイバー防御) を開発し、実世界の条件を反映し、将来の能力ベンチマーキングの基線を確立している。

必要な対応

CISOは脆弱性検出およびパッチ加速プログラムの計画期間として3～5ヶ月のウィンドウを使用すべき。内部脆弱性トリアージおよびパッチ展開速度を、Frontier Modelsが新しい欠陥を特定している速度に対してベンチマークする。現在のパッチングタイムライン (しばしば30～60日) がAI支援の脆弱性の速度を考慮して十分であるかどうかを評価する。パッチが遅れた場合でも露出を減らす「ゼロ常設権限」アーキテクチャと「侵害を想定」の姿勢の採用を検討する。