적대적 증류: 미국 AI 역량 추출을 위한 중국의 캠페인

무슨 일이 있었나

CNAS 연구원 Daniel Remler과 Ben Hayum은 '적대적 증류'를 국가 안보 위협의 별개 범주로 도입하고 정의합니다: 외국 적대국을 위한 모델을 개발하기 위해 미국 AI 시스템에 대한 무단 접근을 통한 대규모 AI 모델 역량 추출. 본 논문은 Anthropic, OpenAI, Google이 모두 대규모로 이러한 활동을 수행하는 명명된 및 명명되지 않은 중국 기관들을 식별했으며, 중국 보안 기구가 이미 DeepSeek과 같은 모델을 통해 증류된 역량을 군사 현대화 및 대량 감시에 통합했다는 것을 문서화합니다. 본 보고서는 '해결되지 않으면 적대적 증류는 미국 AI 생태계의 전략적 취약점을 나타낸다'고 주장하는데, 이는 모델 가중치가 아닌 모델 응답을 이용하여 가중치 탈취 방어를 우회하고, 증류된 미국 역량의 각 세대가 중국의 이득을 복합적으로 증가시키기 때문입니다. 저자들은 이 위협을 더 넓은 미국-중국 AI 경쟁 내에 위치시키고 NSTM-4(2026년 4월)를 정부의 첫 인정으로 분석한 후, 신원 확인, 지리적 통제, API 접근 모니터링을 포함한 일련의 정책 및 산업 대응 방안을 제안합니다.

왜 중요한가

본 논문은 적대적 증류를 위협 범주로서 체계적인 정책 대면 정의 및 분석을 최초로 제공합니다. 이는 엔터프라이즈 AI API 거버넌스, 접근 제어, 기업 보안 태세뿐만 아니라 수출 통제 및 규제 전략에 직접적인 영향을 미칩니다.

필요한 조치

적대적 증류 위협 모델을 고려하여 조직의 API 접근 제어, 고객 신원 확인 관행, 서비스 약관 시행 메커니즘을 검토하십시오. 법무 및 보안 팀은 여기서 문서화된 패턴에 따라 귀사의 AI 서비스가 악용될 수 있는지 노출 상황을 평가하고 정부 업무 담당 부서에 플래그를 지정해야 합니다.