定义 一个结构化流程——目前正在白宫与Anthropic之间进行谈判——用于定义应如何发现、评分、报告和修复AI模型中的漏洞(例如绕过安全控制的越狱),类似于传统软件的软件漏洞披露工作方式。 影响分析在没有商定规则的情况下,AI实验室和政府没有处理危险模型缺陷的共同程序——导致临时性关闭、出口禁令和相互矛盾的应对;正式框架是可预测、协调的AI安全治理的先决条件。