Governance  ·  术语库

Pre-deployment AI evaluation (third-party)

由外部组织在AI模型向公众发布前进行的独立安全和能力评估。评估机构获得模型的早期访问权限,并运行结构化测试以识别危险能力(例如帮助创建武器或执行超出安全范围的自主任务),并衡量模型的安全控制是否真正有效。
第三方部署前评估正迅速成为监管期望——它已是主要实验室的自愿承诺,并在某些新兴框架下被要求。董事会应该询问他们部署的AI系统是否经历过此类评估,以及这些评估是否独立于开发者进行。
参考资料
METR — Summary of Predeployment Evaluation of GPT-5.6 SolAISI Engineering Playbook: An Open Guide to Building AI Evaluation Capabilities
在实时动态中跟踪 了解这一概念在真实 AI 安全与治理事件中的体现。
打开动态 →