开放权重AI模型需要相应的评估方法

事件经过

RAND研究人员提出了一个针对开放权重AI模型的比例评估(PE)框架，这些模型引入了为封闭权重部署设计的评估实践未解决的独特风险因素。作者系统地审查了2025年至2026年4月期间发布的37个开放权重模型家族的评估实践，发现只有一个满足所有四个PE标准(PE1-4)，大多数都不满足任何标准。该框架解决了当前评估规范（假设受控部署）与开放权重模型现实之间的差距，这些模型可以在没有监督的情况下进行微调、量化和部署。

影响分析

开放权重模型正在激增（约16个月内37个家族），但缺乏与其独特风险相称的评估标准。构建或部署开放权重模型的组织面临评估差距：现有基准测试不评估发布后的风险，如针对有害任务的微调或非专家行为者的大规模部署。该框架为政策和采购决策提供了结构化基础。

建议行动

如果您的组织使用或计划使用开放权重模型，请将模型与RAND的PE1-4标准进行比较，以识别评估差距。与您的AI治理团队讨论您的供应商选择和风险评估流程是否考虑了开放权重架构特有的部署后风险。