Black Hat Asia 主题演讲评估智能体攻击性安全自动化的实际局限性

技术说明

在2026年4月27日于新加坡举行的Black Hat Asia大会上，RunSybil首席执行官Ari Herbert-Voss发表主题演讲，探讨了Anthropic的Mythos和OpenAI的GPT-5.5等前沿LLM对攻击性安全的现实影响。尽管承认自主漏洞利用的能力上限正在快速提升，Herbert-Voss认为能力下限——验证和操作化发现结果的能力——并未跟上步伐。英国AI安全研究所对Mythos的评估显示，模型可以在受控环境中完成攻击链的大部分环节，但在真实世界目标上的一致性仍然有限。Herbert-Voss将此类比为2000年代的模糊测试：自动化工具生成大量数据集和可能的漏洞，但仍需要人类专业知识来筛选、验证可利用性并理解根本原因。

攻击途径

LLM在发现和利用低严重性"浅层漏洞"方面表现出"巨大进步"，在中等级漏洞方面取得适度进展，而在最严重缺陷方面收益稀少。攻击向量不是特定的漏洞利用，而是系统性地使用AI来加速漏洞发现和多步攻击执行。组织应为加速的利用时间做好准备：在2023年到2026年间，专业CTF环境中从漏洞发现到利用的平均时间从五个月缩短至10小时。然而，现实世界的部署仍需要人工协调，特别是对于复杂的高影响漏洞。

受影响系统

所有软件系统理论上都暴露于通过LLM辅助的模糊测试和漏洞利用生成进行的加速漏洞发现。发布软件的组织风险最大，因为在漏洞被利用前修补漏洞的时间窗口正在快速缩小。AI基础设施本身（模型推理服务器、智能体编排平台、MCP服务器）也是一个目标类别。

缓解措施

Herbert-Voss强调"左移"比以往任何时候都更重要——组织必须在开发生命周期的早期集成安全测试，因为从漏洞引入到利用之间的时间窗口正在缩小。投资于能够分类AI生成的漏洞报告并优先处理可利用发现的自动化验证管道。安全团队应自己采用AI辅助工具以与攻击者保持平衡。对于高风险系统，考虑内部部署AI红队来在外部对手行动前压力测试防御。最后，认识到智能体攻击性安全是一个可教学的时刻：能力与操作化之间的差距正是人类专业知识仍然不可或缺的地方——招聘并留住能够验证和情境化自动化发现的熟练安全工程师。