定义 Agent-phishing是经典phishing的一个变体,其中被欺骗的目标不是人类,而是自主AI代理——例如,一个安全测试AI代理被精心设计的内容欺骗,导致其泄露自己的访问密钥或突破其沙箱。研究人员发现这种方法在广泛的真实agentic红队测试工具中都有效。 影响分析随着公司部署自主AI代理进行安全测试和其他敏感任务,这表明代理本身——而不仅仅是其人类操作员——成为phishing的目标,开启了一类新的利用方式。