Definisi
Suatu proses terstruktur — yang sedang dinegosiasikan antara White House dan Anthropic — yang mendefinisikan bagaimana kerentanan dalam model AI (seperti jailbreak yang melewati kontrol keamanan) harus ditemukan, dinilai, dilaporkan, dan diperbaiki, serupa dengan cara disclosure kerentanan perangkat lunak bekerja untuk perangkat lunak tradisional.
Mengapa penting
Tanpa aturan yang disepakati, lab AI dan pemerintah tidak memiliki prosedur umum untuk menangani cacat model yang berbahaya — menyebabkan penutupan ad hoc, larangan ekspor, dan respons yang saling bertentangan; kerangka kerja formal adalah prasyarat untuk tata kelola keamanan AI yang dapat diprediksi dan terkoordinasi.