Attack  ·  术语库

Data and model poisoning

一种攻击方式,其中恶意行为者故意破坏用于训练或更新AI模型的数据,或将恶意内容注入模型在运行时使用的知识库。目标是使模型行为不正确、产生有偏差的输出,或创建可以在稍后被触发的隐藏后门。
被污染的训练数据对最终用户是不可见的,可以在产品更新中持续存在,这意味着受到破坏的模型在部署后很长时间内可能会给出微妙错误或有害的答案。污染AI包的供应链攻击(如Shai-Hulud/Miasma蠕虫)表明这已不再是假设问题。
参考资料
OWASP LLM Top 10 2025 — LLM04: Data and Model PoisoningMITRE ATLAS — ML Supply Chain Compromise
在实时动态中跟踪 了解这一概念在真实 AI 安全与治理事件中的体现。
打开动态 →