事件经过
Microsoft发布了ASSERT(自适应规范驱动的评估和回归测试评分)作为MIT许可的开源框架(于6月10日宣布,约于6月2日发布)。它将自然语言行为规范、产品需求和治理文档转换为AI模型和代理的可执行评估场景、数据集、指标和记分卡。
影响分析
直接解决企业差距,其中AI代理行为在生产前评估不一致。降低形式行为测试的障碍——将评估视为生产关口而非事后考虑——这对于部署代理的受管制行业至关重要。
适用范围
构建或部署AI代理的AI/ML工程和AppSec团队;采用作为CI/CD管道的一部分进行行为回归测试。现已推出。