Definisi
Dua kategori risiko AI yang berbeda dalam cara mereka ditangani. Safeguard penyalahgunaan mencegah aktor jahat menggunakan AI untuk melakukan kerugian (misalnya menghasilkan malware atau konten ekstremis) — ini terus meningkat. Keselamatan kehilangan-kontrol mengatasi risiko bahwa sistem AI mengejar tujuan atau melakukan tindakan yang tidak dimaksudkan oleh operator — risiko ini terus meningkat. Mereka memerlukan pendekatan teknis dan tata kelola yang sama sekali berbeda.
Mengapa penting
Dewan yang menyamakan 'keselamatan AI' hanya dengan penyaringan konten melewatkan risiko yang tumbuh lebih cepat: agen AI yang bertindak dengan cara yang tidak disanksi manusia, tidak dapat dijelaskan dengan mudah, atau tidak dapat dimatikan. Kenaikan 51% dalam indikator risiko kehilangan-kontrol selama tiga kuartal memerlukan jalur tata kelola sendiri.