OpenAI의 GPT-5.5 사이버 역량 평가

무슨 일이 있었나

영국 AI 안전 연구소는 OpenAI의 GPT-5.5를 취약점 연구 및 악용 기술을 평가하기 위해 설계된 캡처-더-플래그 형식의 연습을 사용하여 사이버 역량 작업에서 평가했습니다. GPT-5.5는 AISI의 기업 네트워크 공격 시뮬레이션을 엔드-투-엔드로 완료한 두 번째 모델(Anthropic의 Claude Mythos Preview 이후)입니다. 이 다단계 연습은 인간이 완료하는 데 약 20시간이 소요될 것으로 예상됩니다. 초기 체크포인트의 결과에 따르면 GPT-5.5는 Claude Mythos와 유사한 수준의 사이버 성능에 도달하며, 여러 프론티어 개발자들이 고급 공격적 사이버 역량으로 수렴하고 있음을 나타냅니다.

왜 중요한가

서로 다른 개발자의 두 개의 독립적인 프론티어 모델이 이제 구조화된 테스트에서 엔드-투-엔드 자율 사이버 침입 역량을 시연합니다. 이는 고급 공격적 사이버 AI가 더 이상 일회성 역량이 아니라 프론티어 랩 생태계 전반에 걸쳐 재현 가능한 결과임을 시사하며, 방어 조직이 AI 증강 공격에 대비할 타임라인을 단축합니다.

필요한 조치

레드팀과 사이버 방어 리더들을 소집하여 AISI의 공개된 평가 방법론을 검토하고 조직의 위협 모델이 다단계 자율 침입을 고려하는지 평가합니다. 공격자들이 정찰, 측면 이동 및 기계 속도의 악용을 위해 AI를 활용하는 시나리오를 포함하도록 인시던트 대응 플레이북을 업데이트합니다.