정의
모델이 public에 출시되기 전에 외부 조직이 수행하는 AI 모델의 독립적인 안전성 및 기능 평가. 평가 기관은 모델에 대한 조기 접근을 받고 구조화된 테스트를 실행하여 위험한 기능(예: 무기 생성 지원 또는 안전한 범위를 벗어난 자율 작업 실행)을 파악하고 모델의 안전 제어가 실제로 작동하는지 여부를 측정합니다.
왜 중요한가
제3자 배포 전 평가는 빠르게 규제 기대사항이 되고 있습니다. 이는 이미 주요 연구소의 자발적 약속이며 일부 신흥 프레임워크에서는 필수 요구사항입니다. 보드는 자신들이 배포하는 AI 시스템이 그러한 평가를 받았는지, 그리고 그 평가가 개발자로부터 독립적으로 수행되었는지 여부를 확인해야 합니다.