정의
화이트하우스와 Anthropic 사이에서 현재 협상 중인 구조화된 프로세스로, AI 모델의 취약점(안전 제어를 우회하는 jailbreak 등)이 어떻게 발견되고, 점수가 매겨지고, 보고되고, 해결되어야 하는지를 정의하며, 전통적인 소프트웨어의 소프트웨어 취약점 공개 방식과 유사합니다.
왜 중요한가
합의된 규칙이 없으면, AI 연구소와 정부는 위험한 모델 결함을 처리하기 위한 공통 절차가 없어서 임시방편식 종료, 수출 금지, 상충하는 대응으로 이어집니다. 공식적인 프레임워크는 예측 가능하고 조율된 AI 보안 거버넌스의 전제 조건입니다.