定义 一种攻击方式,攻击者通过向AI代理交互的数据或工具中注入恶意指令,来劫持运行中的AI代理——在任务执行中途接管其行为。攻击者本质上"控制"代理执行有害命令(运行恶意软件、数据外泄),使这些命令看起来像是来自合法操作者。 影响分析由于代理具有广泛的系统访问权限——开发者凭证、代码仓库、云基础设施——成功的agentjacking可能与全面的网络入侵一样危险。这种攻击在2026年被记录在生产企业环境中。