Definisi
Praktik memiliki tim khusus — internal atau eksternal — untuk mencoba membuat sistem AI berperilaku buruk: menghasilkan konten berbahaya, membocorkan data pribadi, dimanipulasi, atau gagal dalam cara yang kritis untuk keselamatan. Ini mencerminkan praktik cybersecurity dari ethical hacking tetapi disesuaikan secara khusus untuk sistem AI.
Mengapa penting
Pengujian perangkat lunak standar tidak menangkap mode kegagalan yang spesifik untuk AI. Red-teaming sebelum deployment adalah cara utama organisasi menemukan bagaimana AI mereka dapat disalahgunakan, dan regulator semakin mengharapkan bukti bahwa hal itu telah dilakukan.