定义 一种攻击方式,其中恶意行为者故意破坏用于训练或更新AI模型的数据,或将恶意内容注入模型在运行时使用的知识库。目标是使模型行为不正确、产生有偏差的输出,或创建可以在稍后被触发的隐藏后门。 影响分析被污染的训练数据对最终用户是不可见的,可以在产品更新中持续存在,这意味着受到破坏的模型在部署后很长时间内可能会给出微妙错误或有害的答案。污染AI包的供应链攻击(如Shai-Hulud/Miasma蠕虫)表明这已不再是假设问题。