技术说明
在2026年4月27日于新加坡举行的Black Hat Asia大会上,RunSybil首席执行官Ari Herbert-Voss发表主题演讲,探讨了Anthropic的Mythos和OpenAI的GPT-5.5等前沿LLM对攻击性安全的现实影响。尽管承认自主漏洞利用的能力上限正在快速提升,Herbert-Voss认为能力下限——验证和操作化发现结果的能力——并未跟上步伐。英国AI安全研究所对Mythos的评估显示,模型可以在受控环境中完成攻击链的大部分环节,但在真实世界目标上的一致性仍然有限。Herbert-Voss将此类比为2000年代的模糊测试:自动化工具生成大量数据集和可能的漏洞,但仍需要人类专业知识来筛选、验证可利用性并理解根本原因。
攻击途径
LLM在发现和利用低严重性"浅层漏洞"方面表现出"巨大进步",在中等级漏洞方面取得适度进展,而在最严重缺陷方面收益稀少。攻击向量不是特定的漏洞利用,而是系统性地使用AI来加速漏洞发现和多步攻击执行。组织应为加速的利用时间做好准备:在2023年到2026年间,专业CTF环境中从漏洞发现到利用的平均时间从五个月缩短至10小时。然而,现实世界的部署仍需要人工协调,特别是对于复杂的高影响漏洞。
受影响系统
所有软件系统理论上都暴露于通过LLM辅助的模糊测试和漏洞利用生成进行的加速漏洞发现。发布软件的组织风险最大,因为在漏洞被利用前修补漏洞的时间窗口正在快速缩小。AI基础设施本身(模型推理服务器、智能体编排平台、MCP服务器)也是一个目标类别。
缓解措施
Herbert-Voss强调"左移"比以往任何时候都更重要——组织必须在开发生命周期的早期集成安全测试,因为从漏洞引入到利用之间的时间窗口正在缩小。投资于能够分类AI生成的漏洞报告并优先处理可利用发现的自动化验证管道。安全团队应自己采用AI辅助工具以与攻击者保持平衡。对于高风险系统,考虑内部部署AI红队来在外部对手行动前压力测试防御。最后,认识到智能体攻击性安全是一个可教学的时刻:能力与操作化之间的差距正是人类专业知识仍然不可或缺的地方——招聘并留住能够验证和情境化自动化发现的熟练安全工程师。