战略报告  ·  2026-05-06

我们对OpenAI的GPT-5.5网络安全能力的评估

战略报告High 影响United Kingdom
英国AI安全研究所使用夺旗赛格式练习评估了OpenAI的GPT-5.5的网络安全能力任务,这些练习旨在评估漏洞研究和利用技能。GPT-5.5是第二个完成AISI企业网络攻击仿真端到端测试的模型(继Anthropic的Claude Mythos Preview之后)——这是一项多步骤练习,预计人类需要大约20小时完成。早期检查点的结果表明,GPT-5.5达到了与Claude Mythos相似的网络安全性能水平,这表明多个前沿开发者正在收敛于先进的攻击性网络安全能力。
来自不同开发者的两个独立前沿模型现在在结构化测试中展示了端到端自主网络入侵能力。这表明先进的攻击性网络安全AI不再是一次性能力,而是在前沿实验室生态系统中可重现的结果,压缩了防御组织为AI增强攻击做准备的时间表。
召集你的红队和网络防御负责人审查AISI发布的评估方法,并评估你的组织威胁模型是否考虑了多步骤自主入侵。更新事件响应手册,包含攻击者以机器速度利用AI进行侦察、横向移动和利用的场景。
来源
UK AI Safety Institute
在实时动态中查看 浏览更多 AI 安全与治理相关发现 — 每日清晨更新。
打开动态 →