Attack  ·  术语库

Indirect prompt injection

一种特定形式的提示注入,其中恶意指令不是由用户直接输入,而是隐藏在AI自行检索和读取的外部内容中——例如,嵌入在网页、共享文档或日历邀请中的隐形指令。攻击者从不直接与AI交互;他们将指令植入到AI最终会遇到的数据中。
这对于浏览网络、读取电子邮件或处理文档的AI助手来说特别危险,因为攻击面遍布互联网上的任何地方——不仅仅局限于你自己的系统。研究证实它在真实企业部署中对当今领先的AI工具有效。
参考资料
OWASP Top 10 for LLM Applications — LLM01: Prompt Injection
在实时动态中跟踪 了解这一概念在真实 AI 安全与治理事件中的体现。
打开动态 →