Question 1

Jailbreak severity benchmark란 무엇인가요?

Accepted Answer

AI 탈옥의 위험성을 평가하는 공식적인 채점 시스템 — 안전 우회가 얼마나 멀리 진행되었는지, 어떤 해로운 기능이 접근 가능해졌는지, 얼마나 쉽게 반복될 수 있는지, 그리고 어떤 실제 피해가 발생할 수 있는지 등의 요소를 측정합니다. White House와 Anthropic은 이러한 벤치마크의 첫 번째 정부-산업 버전을 적극적으로 개발 중입니다.

Question 2

Jailbreak severity benchmark이(가) AI 보안에서 왜 중요한가요?

Accepted Answer

합의된 심각도 척도가 없으면 정부와 기업들은 AI 모델이 배포하기에 너무 위험하거나 회수되어야 하는지를 결정하기 위한 공통 언어를 갖지 못합니다 — 벤치마크는 모든 신뢰할 수 있는 AI 모델 거버넌스 체제의 기초입니다.