定义 由外部组织在AI模型向公众发布前进行的独立安全和能力评估。评估机构获得模型的早期访问权限,并运行结构化测试以识别危险能力(例如帮助创建武器或执行超出安全范围的自主任务),并衡量模型的安全控制是否真正有效。 影响分析第三方部署前评估正迅速成为监管期望——它已是主要实验室的自愿承诺,并在某些新兴框架下被要求。董事会应该询问他们部署的AI系统是否经历过此类评估,以及这些评估是否独立于开发者进行。