Anthropic Institute: 'AI가 자기 자신을 구축할 때' — 가속화하는 재귀적 자기 개선의 정량적 증거 및 보안 영향

무슨 일이 있었나

Anthropic의 Institute는 6월 4일에 이전에 보고되지 않은 내부 데이터와 공개 벤치마크를 사용하여 AI가 이미 Anthropic에서 AI 개발을 실질적으로 가속화하고 있음을 보여주는 상세한 분석을 발표했습니다: 엔지니어들은 2021–2025년보다 분기당 8배 더 많은 코드를 배포하고, Claude는 12시간의 소프트웨어 작업을 자율적으로 완료할 수 있으며, 작업 완료 기간은 4개월마다 2배씩 증가하고 있습니다. 이 게시물은 재귀적 자기 개선으로의 경로를 공식적으로 설명하고, 전환을 관리하기 위한 국제 조율을 요구하며, 시스템이 자신의 후속 시스템을 구축할 수 있다면 '우리가 이들을 보안하고, 모니터링하고, 그들의 행동을 형성하는 방식이 모두 훨씬 더 중요해진다'고 명시적으로 지적합니다.

왜 중요한가

이것은 내부 텔레메트리를 사용하여 AI 주도의 AI 개발 속도를 정량화하는 첫 번째 Anthropic 발표이며, 재귀적 자기 개선을 먼 미래의 가설이 아닌 단기 거버넌스 및 보안 문제로 구성합니다. AI 보안 프로그램에 대한 함의는 구체적입니다: 현재의 AI 안전 평가, 레드팀 주기, 모니터링 아키텍처는 기계 속도로 개선되는 시스템에 맞게 재설계되어야 할 수 있으며, Anthropic은 다른 고위험 기술을 위한 것들과 비교 가능한 국제 조율 메커니즘을 명시적으로 요구합니다.

필요한 조치

AI 거버넌스 위험 레지스터에 재귀적 자기 개선 궤적을 포함시키십시오; 현재 AI 보안 평가 프로그램이 4개월마다 기능이 2배로 증가하는 속도를 따라갈 수 있는지 검토하십시오; 그리고 클라이언트 정책 브리프에 포함하기 위해 Anthropic Institute의 제안된 조율 프로세스를 추적하십시오.