Agent-phishing — AI Security Glossary | eyeon.ai

定义

Agent-phishing是经典phishing的一个变体，其中被欺骗的目标不是人类，而是自主AI代理——例如，一个安全测试AI代理被精心设计的内容欺骗，导致其泄露自己的访问密钥或突破其沙箱。研究人员发现这种方法在广泛的真实agentic红队测试工具中都有效。

影响分析

随着公司部署自主AI代理进行安全测试和其他敏感任务，这表明代理本身——而不仅仅是其人类操作员——成为phishing的目标，开启了一类新的利用方式。

相关术语

AI red-teaming Prompt injection Sandbox escape (AI coding agents)

在实时动态中跟踪 了解这一概念在真实 AI 安全与治理事件中的体现。

打开动态 →