指南  ·  2026-05-14

英国AI安全研究所:前沿模型已打破所有先前的自主网络能力趋势线

指南High 影响United Kingdom
英国AI安全研究所(AISI)代表英国政府进行部署前评估,于2026年5月13日发布独立研究显示,Anthropic的Claude Mythos Preview和OpenAI的GPT-5.5在自主网络任务完成方面大幅超越了所有先前的预测趋势。AISI此前估计前沿模型80%可靠性网络时间范围大约每5个月翻倍(从2025年11月的8个月翻倍时间缩短)。Mythos Preview和GPT-5.5现已超越所有测量趋势线:Mythos成为首个完成AISI两个网络靶场的模型(在10次尝试中6次解决了'The Last Ones'32步攻击,在10次尝试中3次完成了此前未被解决的'Cooling Tower')。来自METR的独立研究证实了自2024年底以来约4个月的翻倍时间。
AISI报告提供了定量的、政府支持的证据表明前沿AI能力正以比先前模型预测更快的速度加速。从5个月到4个月翻倍时间的转变(以及Claude Mythos和GPT-5.5在网络靶场上的超越表现)表明能力扩展出现不连续性。这直接支撑了Palo Alto和国会立法者引用的3-5个月窗口期:如果自主网络任务复杂性每4-5个月翻倍,组织大约有一个翻倍周期的时间来强化防御,然后当代模型就能自主执行多阶段攻击。AISI正在开发更具挑战性的评估(新的网络靶场、主动网络防御)以反映真实世界条件,为未来能力基准测试建立基线。
CISO应将3-5个月窗口期作为漏洞检测和补丁加速程序的规划时间范围。将内部漏洞分类和补丁部署速度与前沿模型识别新漏洞的速率进行基准对比。评估当前的补丁时间线(通常为30-60天)在AI辅助利用速度下是否足够。考虑采用"零常驻权限"架构和"假设已被攻破"态势,以减少即使补丁滞后时的暴露面。
来源
Researchers say AI just broke every benchmark for autonomous cyber capability
在实时动态中查看 浏览更多 AI 安全与治理相关发现 — 每日清晨更新。
打开动态 →