Concept  ·  Glosarium

Misuse safeguards vs. loss-of-control safety

Dua kategori risiko AI yang berbeda dalam cara mereka ditangani. Safeguard penyalahgunaan mencegah aktor jahat menggunakan AI untuk melakukan kerugian (misalnya menghasilkan malware atau konten ekstremis) — ini terus meningkat. Keselamatan kehilangan-kontrol mengatasi risiko bahwa sistem AI mengejar tujuan atau melakukan tindakan yang tidak dimaksudkan oleh operator — risiko ini terus meningkat. Mereka memerlukan pendekatan teknis dan tata kelola yang sama sekali berbeda.
Dewan yang menyamakan 'keselamatan AI' hanya dengan penyaringan konten melewatkan risiko yang tumbuh lebih cepat: agen AI yang bertindak dengan cara yang tidak disanksi manusia, tidak dapat dijelaskan dengan mudah, atau tidak dapat dimatikan. Kenaikan 51% dalam indikator risiko kehilangan-kontrol selama tiga kuartal memerlukan jalur tata kelola sendiri.
Referensi
NIST AI Risk Management Framework — Trustworthiness
Pantau di umpan langsung Lihat bagaimana hal ini terwujud dalam perkembangan keamanan dan tata kelola AI nyata.
Buka umpan →