Indirect prompt injection — AI Security Glossary

정의

사용자가 직접 입력하지 않고 AI가 스스로 검색하고 읽는 외부 콘텐츠 내에 숨겨진 악의적 지시문이 포함된 프롬프트 인젝션의 한 형태입니다. 예를 들어, 웹 페이지, 공유 문서 또는 캘린더 초대장에 숨겨진 지시문이 포함될 수 있습니다. 공격자는 AI와 직접 상호작용하지 않으며, AI가 결국 만나게 될 데이터에 자신의 지시문을 숨깁니다.

왜 중요한가

이는 웹을 탐색하거나 이메일을 읽거나 문서를 처리하는 AI 어시스턴트에 특히 위험합니다. 공격 범위가 자체 시스템만이 아니라 인터넷 어디서나 존재하기 때문입니다. 연구에 따르면 현재의 주요 AI 도구가 실제 엔터프라이즈 배포에서 이에 대해 취약함이 확인되었습니다.