Attack  ·  Glosarium

Prompt injection

Serangan di mana instruksi berbahaya disembunyikan di dalam teks yang dibaca oleh AI — seperti dokumen, email, atau halaman web — yang menipu AI agar mengabaikan instruksi aslinya dan melakukan apa yang diinginkan penyerang. Pikirkan ini sebagai kesetaraan AI dari memalsukan memo dari CEO dan menyelipnya ke dalam kotak masuk karyawan. AI tidak dapat secara andal membedakan antara instruksi sah dari operator dan instruksi palsu dari penyerang.
Setiap AI yang membaca atau merangkum konten eksternal — email pelanggan, halaman web, dokumen yang diunggah — adalah target potensial. Serangan yang berhasil dapat menyebabkan AI membocorkan data rahasia, mengambil tindakan tidak sah, atau menyebarkan informasi salah, semuanya tanpa pengguna atau operator menyadarinya.
Referensi
OWASP Top 10 for LLM Applications — LLM01: Prompt InjectionNIST CSRC Glossary: Prompt Injection
Pantau di umpan langsung Lihat bagaimana hal ini terwujud dalam perkembangan keamanan dan tata kelola AI nyata.
Buka umpan →