Governance  ·  용어집

Pre-deployment AI evaluation (third-party)

모델이 public에 출시되기 전에 외부 조직이 수행하는 AI 모델의 독립적인 안전성 및 기능 평가. 평가 기관은 모델에 대한 조기 접근을 받고 구조화된 테스트를 실행하여 위험한 기능(예: 무기 생성 지원 또는 안전한 범위를 벗어난 자율 작업 실행)을 파악하고 모델의 안전 제어가 실제로 작동하는지 여부를 측정합니다.
제3자 배포 전 평가는 빠르게 규제 기대사항이 되고 있습니다. 이는 이미 주요 연구소의 자발적 약속이며 일부 신흥 프레임워크에서는 필수 요구사항입니다. 보드는 자신들이 배포하는 AI 시스템이 그러한 평가를 받았는지, 그리고 그 평가가 개발자로부터 독립적으로 수행되었는지 여부를 확인해야 합니다.
참고 자료
METR — Summary of Predeployment Evaluation of GPT-5.6 SolAISI Engineering Playbook: An Open Guide to Building AI Evaluation Capabilities
라이브 피드에서 추적 이 개념이 실제 AI 보안·거버넌스 동향에서 어떻게 나타나는지 확인하세요.
피드 열기 →