Attack  ·  용어집

Agentjacking

실행 중인 AI 에이전트를 탈취하는 공격으로, 공격자가 에이전트와 상호작용하는 데이터나 도구를 통해 악의적인 명령어를 주입하여 작업 중간에 에이전트의 행동을 제어한다. 공격자는 본질적으로 에이전트를 '조종'하여 해로운 명령어(악성 소프트웨어 실행, 데이터 유출)를 마치 합법적인 운영자로부터 나온 명령처럼 실행하게 한다.
에이전트는 개발자 자격증명, 코드 저장소, 클라우드 인프라 등 광범위한 시스템 접근 권한을 가지고 있기 때문에, 성공한 에이전트재킹은 완전한 네트워크 침입만큼 심각할 수 있다. 이는 2026년에 프로덕션 엔터프라이즈 환경에서 기록되었다.
참고 자료
MITRE ATLAS — Adversarial Threat Landscape for AI Systems
라이브 피드에서 추적 이 개념이 실제 AI 보안·거버넌스 동향에서 어떻게 나타나는지 확인하세요.
피드 열기 →