AISI 엔지니어링 플레이북: AI 평가 역량 구축을 위한 공개 가이드

무슨 일이 있었나

영국 AI 보안 연구소는 2026년 6월 18일에 엔지니어링 플레이북을 발표했으며, 최첨단 AI 모델을 평가하기 위해 개발한 완전한 평가 인프라 스택을 공개했습니다. 플레이북은 다섯 가지 계층(평가, 격리, 연결, 실행, 확장)으로 구조화되어 있으며, 엄격하고 재현 가능한 AI 평가를 규모 있게 실행하는 데 필요한 방법, 실습, 그리고 지원 인프라를 문서화합니다. AISI는 이를 '최첨단 AI 시스템을 평가하는 과정에서 개발한 방법과 실습을 포함하는 완전한 리소스'라고 설명하며, 연구자 및 조직이 '처음부터 시작하지 않고 엄격한 평가 역량을 구축할 수 있도록' 명시적으로 의도되었습니다. 이 릴리스는 AISI의 Inspect AI 도구킷(METR이 국제 AI 안전 보고서 2026에서 인용한 228개 과제의 시간 범위 평가를 위해 채택했으며, Apollo Research가 내부 프레임워크를 폐기한 후 채택)을 기반으로 하며, 보안 샌드박싱, 모델 제공자 프록싱, 계산 관리, 그리고 슈퍼컴퓨터 규모의 추론을 다루는 인프라 문서화를 포함합니다. 플레이북은 engineering-playbook.aisi.org.uk에서 자유롭게 이용 가능합니다.

왜 중요한가

최첨단 AI 모델에 대한 신뢰할 수 있는 독립적인 평가를 실행하려는 모든 조직(정부, 기업, 또는 연구 기관)의 경우, 이는 이제 세계에서 선도적인 정부 AI 평가 기관의 권위 있는 공개 참고자료입니다. 이를 채택하면 평가 프로그램 설계를 위험 완화하고 신흥 국제 표준과의 정렬을 나타냅니다.

필요한 조치

AI 안전 및 평가 팀과 함께 내부 최첨단 모델 평가 프로그램을 위한 기준선 참고자료로 공유합니다. 현재 설정에서 다섯 가지 인프라 계층(평가, 격리, 연결, 실행, 확장) 중 어느 것이 부족한지 평가하고 이에 따라 우선순위를 지정합니다.