무슨 일이 있었나
Microsoft는 ASSERT(적응형 사양 기반 평가 및 회귀 테스트)를 MIT 라이선스 오픈소스 프레임워크로 출시했습니다(6월 10일 발표, ~6월 2일 공개). 자연언어 동작 사양, 제품 요구사항 및 거버넌스 문서를 AI 모델 및 에이전트용 실행 가능한 평가 시나리오, 데이터세트, 메트릭 및 스코어카드로 변환합니다.
왜 중요한가
AI 에이전트 동작이 프로덕션 전에 불일치하게 평가되는 엔터프라이즈 갭을 직접 해결합니다. 형식적 동작 테스트의 진입 장벽을 낮춤 — 평가를 사후 대응이 아닌 프로덕션 게이트로 취급 — 에이전트를 배포하는 규제 산업에 중요합니다.
적용 범위
AI/ML 엔지니어링 및 AppSec 팀이 AI 에이전트를 구축 또는 배포할 때; CI/CD 파이프라인의 일부로 동작 회귀 테스트를 위해 채택합니다. 지금 사용 가능합니다.