对抗性蒸馏：中国提取美国AI能力的活动

事件经过

CNAS研究人员Daniel Remler和Ben Hayum引入并定义了"对抗性蒸馏"为一个独特的国家安全威胁类别：通过对美国AI系统的未授权访问大规模提取AI模型能力，以开发为外国对手服务的模型。该论文记录了Anthropic、OpenAI和Google都已识别出中文命名和未命名的中国实体大规模进行这一活动，并且中国安保机制已经通过DeepSeek等模型将蒸馏的能力纳入军事现代化和大规模监视中。该报告论证"如果不加以解决，对抗性蒸馏对美国AI生态系统代表了战略脆弱性"，因为它通过利用模型响应而非模型权重来规避权重盗窃防御，并且蒸馏的美国能力的每一代都会加强中国的收益。作者将威胁置于更广泛的美中AI竞争背景中，分析NSTM-4（2026年4月）作为政府首次承认，随后提出一系列政策和行业对抗措施，包括身份验证、地理控制和API访问监控。

影响分析

本论文提供了对抗性蒸馏作为威胁类别的首个系统性政策导向型定义和分析；它对企业AI API治理、访问控制和企业安全态势，以及出口管制和监管战略具有直接影响。

建议行动

根据对抗性蒸馏威胁模型审视你的组织的API访问控制、客户身份验证实践和服务条款执行机制；法律和安全团队应评估风险敞口，如果你的AI服务可能被利用遵循此处记录的模式，应向政府事务部门汇报。