Definisi
Serangan di mana instruksi berbahaya disembunyikan di dalam teks yang dibaca oleh AI — seperti dokumen, email, atau halaman web — yang menipu AI agar mengabaikan instruksi aslinya dan melakukan apa yang diinginkan penyerang. Pikirkan ini sebagai kesetaraan AI dari memalsukan memo dari CEO dan menyelipnya ke dalam kotak masuk karyawan. AI tidak dapat secara andal membedakan antara instruksi sah dari operator dan instruksi palsu dari penyerang.
Mengapa penting
Setiap AI yang membaca atau merangkum konten eksternal — email pelanggan, halaman web, dokumen yang diunggah — adalah target potensial. Serangan yang berhasil dapat menyebabkan AI membocorkan data rahasia, mengambil tindakan tidak sah, atau menyebarkan informasi salah, semuanya tanpa pengguna atau operator menyadarinya.