기술 설명
감사 결과에 따르면 prompt injection이 프로덕션 AI 배포의 73%에 존재하며, 간접(데이터 기반) injection이 현재 문서화된 엔터프라이즈 공격 시도의 >80%를 차지합니다. OpenAI는 이 문제가 완전히 제거될 가능성이 낮다고 공개적으로 인정했습니다.
공격 경로
직접 prompt 조작 및 독성 문서, 웹 페이지, 그리고 에이전트에 의해 신뢰할 수 있는 데이터로 소비되는 도구 출력을 통한 간접 injection.
영향받는 시스템
모든 LLM 기반 애플리케이션 및 에이전트; 특히 광범위한 도구 접근 권한이 있는 agentic AI에 대해 중요합니다.
완화 방안
명령어/데이터 경계 강제; 도구 호출 샌드박싱; 도구 범위에 최소 권한 적용; 행동 이상 모니터링; 지속적인 red-team.