Indirect prompt injection — AI Security Glossary

定义

一种特定形式的提示注入，其中恶意指令不是由用户直接输入，而是隐藏在AI自行检索和读取的外部内容中——例如，嵌入在网页、共享文档或日历邀请中的隐形指令。攻击者从不直接与AI交互；他们将指令植入到AI最终会遇到的数据中。

影响分析

这对于浏览网络、读取电子邮件或处理文档的AI助手来说特别危险，因为攻击面遍布互联网上的任何地方——不仅仅局限于你自己的系统。研究证实它在真实企业部署中对当今领先的AI工具有效。

参考资料

在实时动态中跟踪 了解这一概念在真实 AI 安全与治理事件中的体现。