事件经过
OWASP GenAI 安全项目于 2026 年 7 月 1 日左右发布了《GenAI 红队测试手册》1.0 版本,现已开放公开评论期。该手册定义了一个八阶段对抗性测试方法论(规划与范围界定、侦察与指纹识别、表面映射、利用、持久化与提权、后利用与影响、评估与报告、后期交接与修复),用于测试生成式和代理型 AI 系统,包含社区贡献(例如 NeuralTrust 的 Echo Chamber 多轮越狱技术被记录为真实示例)。它明确交叉引用了 OWASP Top 10 for LLM Applications、OWASP Top 10 for Agentic Applications、MITRE ATLAS 和 NIST AI RMF。
影响分析
这是来自公认标准机构的第一个社区标准化、基于阶段的 GenAI/代理系统红队测试方法论,为安全团队和审计人员提供了可重复、可追踪的流程(包括攻击成功率和 pass@k 等指标),而不是临时测试。由于它将发现结果与现有风险分类法(LLM Top 10、Agentic Top 10、ATLAS、AI RMF)关联,它可能会成为 AI 红队交接和供应商对抗性测试严谨性声明的参考点。
建议行动
安全和红队负责人应在公开评论期间审查该草案,将现有内部 AI 红队测试实践映射到八阶段结构,并在评论期截止前通过 OWASP GenAI 安全项目渠道提交反馈。