기술 설명
TU Berlin과 Max Planck Institute for Security and Privacy의 연구자들이 운영 체제 보안 관점에서 LLM 기반 에이전트에 대한 체계적 보안 분석을 발표했습니다. 이 논문은 OpenClaw 스타일 에이전트를 조사하고, 통합 에이전트 아키텍처를 도출하며, 널리 사용되는 네 가지 에이전트를 평가합니다. 이 연구는 여러 보호 메커니즘이 적당한 수준의 공격자 능력 하에서 실패하며, 안전한 운영을 위해서는 상세한 시스템 지식과 신중한 설정이 필요함을 발견했습니다.
공격 경로
이 연구는 AI 에이전트와 운영 체제가 유사한 보호 문제에 직면해 있음을 보여줍니다. 둘 다 신뢰할 수 없는 주체를 대신하여 작업을 실행하고, 제어된 인터페이스를 통해 특권 기능을 노출하며, 데이터와 권한이 보안 경계를 넘지 않도록 방지해야 합니다. 이 비유는 LLM을 신뢰할 수 없는 사용자로, 에이전트 런타임을 커널로, 도구를 시스템 호출로, 스킬을 프로그램으로, LLM 컨텍스트를 프로세스 메모리로 매핑합니다.
영향받는 시스템
광범위한 도구 사용, 제3자 스킬 통합, 지속적 상태를 노출하는 OpenClaw 스타일 에이전트 및 유사 시스템입니다. 취약점 분석은 구현별이 아닌 아키텍처적이며, 더 넓은 범위의 자율 에이전트 프레임워크에 적용됩니다.
완화 방안
확립된 OS 보안 원칙을 적용합니다: 격리, 권한 분리, 중재, 제한, 최소 권한. 계층별 신뢰 강제 대신 통합 정책 경계를 구현합니다. 에이전트 컨텍스트를 신뢰할 수 없는 메모리로 취급하고, 스킬 실행을 샌드박싱하며, 도구 호출에 의무 접근 제어를 강제하고, 귀속 및 감사를 위해 모든 특권 작업을 기록합니다.