연구자들이 AI 에이전트 프레임워크를 위한 운영 체제 보안 모델 제안

기술 설명

TU Berlin과 Max Planck Institute for Security and Privacy의 연구자들이 운영 체제 보안 관점에서 LLM 기반 에이전트에 대한 체계적 보안 분석을 발표했습니다. 이 논문은 OpenClaw 스타일 에이전트를 조사하고, 통합 에이전트 아키텍처를 도출하며, 널리 사용되는 네 가지 에이전트를 평가합니다. 이 연구는 여러 보호 메커니즘이 적당한 수준의 공격자 능력 하에서 실패하며, 안전한 운영을 위해서는 상세한 시스템 지식과 신중한 설정이 필요함을 발견했습니다.

공격 경로

이 연구는 AI 에이전트와 운영 체제가 유사한 보호 문제에 직면해 있음을 보여줍니다. 둘 다 신뢰할 수 없는 주체를 대신하여 작업을 실행하고, 제어된 인터페이스를 통해 특권 기능을 노출하며, 데이터와 권한이 보안 경계를 넘지 않도록 방지해야 합니다. 이 비유는 LLM을 신뢰할 수 없는 사용자로, 에이전트 런타임을 커널로, 도구를 시스템 호출로, 스킬을 프로그램으로, LLM 컨텍스트를 프로세스 메모리로 매핑합니다.

영향받는 시스템

광범위한 도구 사용, 제3자 스킬 통합, 지속적 상태를 노출하는 OpenClaw 스타일 에이전트 및 유사 시스템입니다. 취약점 분석은 구현별이 아닌 아키텍처적이며, 더 넓은 범위의 자율 에이전트 프레임워크에 적용됩니다.

완화 방안

확립된 OS 보안 원칙을 적용합니다: 격리, 권한 분리, 중재, 제한, 최소 권한. 계층별 신뢰 강제 대신 통합 정책 경계를 구현합니다. 에이전트 컨텍스트를 신뢰할 수 없는 메모리로 취급하고, 스킬 실행을 샌드박싱하며, 도구 호출에 의무 접근 제어를 강제하고, 귀속 및 감사를 위해 모든 특권 작업을 기록합니다.