定义 一种攻击方式,其中恶意指令或负载被隐藏在AI代理被设计为信任和使用的工具的描述、输出或配置中。当代理调用该工具时,它会在不知情的情况下执行攻击者的命令——重定向流量、泄露机密或执行破坏性操作。 影响分析随着AI代理通过Model Context Protocol和类似框架连接到更多业务工具,工具投毒成为攻击者劫持整个自动化工作流的可扩展方式,而无需接触AI模型本身。单个被投毒的工具可以级联影响每个信任它的代理。