战略报告  ·  2026-06-04

对抗性蒸馏:中国提取美国AI能力的活动

战略报告High 影响Global
CNAS研究人员Daniel Remler和Ben Hayum引入并定义了"对抗性蒸馏"为一个独特的国家安全威胁类别:通过对美国AI系统的未授权访问大规模提取AI模型能力,以开发为外国对手服务的模型。该论文记录了Anthropic、OpenAI和Google都已识别出中文命名和未命名的中国实体大规模进行这一活动,并且中国安保机制已经通过DeepSeek等模型将蒸馏的能力纳入军事现代化和大规模监视中。该报告论证"如果不加以解决,对抗性蒸馏对美国AI生态系统代表了战略脆弱性",因为它通过利用模型响应而非模型权重来规避权重盗窃防御,并且蒸馏的美国能力的每一代都会加强中国的收益。作者将威胁置于更广泛的美中AI竞争背景中,分析NSTM-4(2026年4月)作为政府首次承认,随后提出一系列政策和行业对抗措施,包括身份验证、地理控制和API访问监控。
本论文提供了对抗性蒸馏作为威胁类别的首个系统性政策导向型定义和分析;它对企业AI API治理、访问控制和企业安全态势,以及出口管制和监管战略具有直接影响。
根据对抗性蒸馏威胁模型审视你的组织的API访问控制、客户身份验证实践和服务条款执行机制;法律和安全团队应评估风险敞口,如果你的AI服务可能被利用遵循此处记录的模式,应向政府事务部门汇报。
来源
CNAS — Adversarial Distillation: China's Campaign to Extract American AI Capabilities
在实时动态中查看 浏览更多 AI 安全与治理相关发现 — 每日清晨更新。
打开动态 →