Anthropic, Claude Fable 5 및 Mythos 5 System Card 발표 — 상세한 사이버 능력 평가, 이중 구성 안전 아키텍처 및 에이전트 프롬프트 인젝션 벤치마크 결과

무슨 일이 있었나

2026년 6월 9일, Anthropic은 Claude Fable 5를 일반 사용자에게 공개했으며 Claude Mythos 5를 제한된 사이버 방어자 그룹을 위해 공개했으며, 상세한 시스템 카드를 함께 발표했습니다. 주요 결과: Mythos 5는 현재까지 평가된 가장 강력한 사이버 모델이며, 익스플로잇 개발에서 Opus 4.8을 크게 앞지름; Fable 5는 사이버 관련 쿼리가 감지될 때 약 5%의 세션을 Opus 4.8으로 라우팅하는 사이버보안 분류기를 사용; Mythos 5는 외부 Gray Swan 프롬프트 인젝션 벤치마크에서 최저(최고) 점수 달성; 사이버보안 보안장치 우회는 '극도로 어렵지만 불가능하지는 않은' 것으로 평가됨; 그리고 무방비 Mythos 5는 화학 및 생물학 연구에서 '충분한 자원을 가진 위협 행위자를 상당히 향상시킬 수 있습니다'. Fable 5는 $10/1M 입력 / $50/1M 출력 토큰으로 가격이 책정되었으며 — Mythos Preview 가격의 절반 이상 저렴합니다.

왜 중요한가

이것은 Mythos 규모의 이중 용도 사이버 위험을 정량화하고 이를 관리하기 위해 사용되는 특정 보안장치 아키텍처를 문서화하는 첫 번째 Tier 2 시스템 카드입니다. Mythos 클래스 능력 수준의 Fable 5의 공개 출시 — 분류기가 있더라도 — AI 보조 사이버 공격의 위협 모델이 크게 변경되었음을 의미합니다: 방어자는 이제 적대자가 비교 가능한 능력의 모델에 접근할 수 있거나 접근할 것이라고 가정해야 합니다. Gray Swan 프롬프트 인젝션 벤치마크 점수는 에이전트 안전 평가 프레임워크를 위한 유용한 외부 기준점입니다.

필요한 조치

Fable 5/Mythos 5 시스템 카드를 읽고 조직의 AI 위협 모델을 업데이트하세요; 특히 Gray Swan 벤치마크와 METR 평가 결과를 자신의 레드팀 범위의 기준점으로 사용하고, Mythos 클래스 모델이 이제 Fable 5를 통해 일반 대중에게 접근 가능하다는 의미를 클라이언트에 간략히 설명하세요.