Governance  ·  Glosarium

AI model security flaw disclosure framework

Suatu proses terstruktur — yang sedang dinegosiasikan antara White House dan Anthropic — yang mendefinisikan bagaimana kerentanan dalam model AI (seperti jailbreak yang melewati kontrol keamanan) harus ditemukan, dinilai, dilaporkan, dan diperbaiki, serupa dengan cara disclosure kerentanan perangkat lunak bekerja untuk perangkat lunak tradisional.
Tanpa aturan yang disepakati, lab AI dan pemerintah tidak memiliki prosedur umum untuk menangani cacat model yang berbahaya — menyebabkan penutupan ad hoc, larangan ekspor, dan respons yang saling bertentangan; kerangka kerja formal adalah prasyarat untuk tata kelola keamanan AI yang dapat diprediksi dan terkoordinasi.
Referensi
Politico: White House–Anthropic AI security rules negotiations
Pantau di umpan langsung Lihat bagaimana hal ini terwujud dalam perkembangan keamanan dan tata kelola AI nyata.
Buka umpan →