Prompt injection — AI Security Glossary | eyeon.ai

Definisi

Serangan di mana instruksi berbahaya disembunyikan di dalam teks yang dibaca oleh AI — seperti dokumen, email, atau halaman web — yang menipu AI agar mengabaikan instruksi aslinya dan melakukan apa yang diinginkan penyerang. Pikirkan ini sebagai kesetaraan AI dari memalsukan memo dari CEO dan menyelipnya ke dalam kotak masuk karyawan. AI tidak dapat secara andal membedakan antara instruksi sah dari operator dan instruksi palsu dari penyerang.

Mengapa penting

Setiap AI yang membaca atau merangkum konten eksternal — email pelanggan, halaman web, dokumen yang diunggah — adalah target potensial. Serangan yang berhasil dapat menyebabkan AI membocorkan data rahasia, mengambil tindakan tidak sah, atau menyebarkan informasi salah, semuanya tanpa pengguna atau operator menyadarinya.

Temuan tentang topik ini (53)

Eclipse Theia AI Chat — Markdown Image Tags Mengaktifkan Prompt-Injection-Driven Data Exfiltration (CVE-2026-22551)Eclipse Theia AI Chat — Nama File/Direktori Workspace Disuntikkan ke dalam System Prompt AI (CVE-2026-44688)Worm Rantai Pasokan PyPI Shai-Hulud/Hades Menargetkan Paket AI/ML dengan Penghindaran Pemindai LLM dan Daemon Penghapus Kredensial Rantai Eskalasi Privilege LiteLLM Low-Privilege → Admin → RCE (CVSS 9.9, Obsidian Security)Panduan Bersama CISA + G7: "Software Bill of Materials untuk AI – Elemen Minimum"Varonis SearchLeak (CVE-2026-42824) — One-Click Data Exfiltration Chain in Microsoft 365 Copilot Enterprise Search, Patched OpenClaw Zalo allowFrom Policy Bypass via Mutable Contact Display Metadata (CVE-2026-53857)TrueFoundry AI Gateway — Integrasi Lasso Security untuk Perlindungan GenAI Terpusat Spring AI Vector Stores — Injeksi Karakter Khusus Memungkinkan Eksekusi Kueri Arbitrer di Elasticsearch, OpenSearch, dan GemFire Kampanye Shai-Hulud/Hades: PyPI Supply-Chain Worm Menyuntikkan Prompt Penghindaran AI Scanner dan Backdoor Konfigurasi AI Coding Agent LangGraph RCE Chain: SQL Injection + msgpack Deserialization in Stateful Agent Checkpointer (CVE-2025-67644 + CVE-2026-28277)Google Menerbitkan Panduan Keamanan WebMCP Agent — Manifest Berbahaya dan Output Tool Terkontaminasi sebagai Vektor Serangan Utama dengan Tindakan Balasan Deterministik dan Probabilistik Anthropic Menerbitkan Kartu Sistem Claude Fable 5 dan Mythos 5 — Evaluasi Kemampuan Siber Terperinci, Arsitektur Keamanan Dual-Config, dan Hasil Benchmark Prompt-Injection Agentic Laporan CSA / Adversa AI AIRQ: 98% Agen AI Produksi Membawa Trifecta Mematikan — Hanya 11% Terlindungi dengan Memadai Worm Miasma Meningkat ke Pembajakan AI Coding Agent — 73 Repo GitHub Microsoft Dinonaktifkan Setelah Injeksi Payload SessionStart Hook CSA Labs: AI Agent Lethal Trifecta — 98% Agen Produksi Secara Bersamaan Menggabungkan Akses Data Sensitif, Input Tidak Terpercaya, dan Kemampuan Tindakan Keluar Blog Keamanan Microsoft: Bypass Izin CI/CD di Claude Code GitHub Actions Memungkinkan Kompromi Rantai Pasokan — Panduan Remedasi Dipublikasikan OpenAI Merilis Mode Lockdown ChatGPT — Kontrol Produksi Bawaan Pertama yang Menargetkan Eksfiltrasi Data Prompt-Injection Penelitian Keamanan Microsoft: Mengamankan Saluran CI/CD Terhadap Ancaman AI Agentic — Studi Kasus Claude Code GitHub Action Noma Meluncurkan Agentic Access Control — Dynamic Registry, Identity, dan Policy Enforcement untuk AI Agents dan MCP Servers CVE-2026-42074 (CVSS 9.3): OpenClaude Coding-Agent CLI — LLM Dapat Menonaktifkan Sandbox-nya Sendiri melalui Parameter Schema yang Terekspos OWASP Agent Memory Guard Dirilis — Pertahanan Runtime Open-Source untuk Agentic Memory Poisoning (ASI06)Microsoft Meluncurkan MXC — Sandbox yang Ditegakkan Kernel Tingkat OS untuk AI Agents, dengan OpenAI dan Nvidia sebagai Launch Partners Cyberhaven Menerbitkan Panduan Keamanan MCP Enterprise — Tool Poisoning, Indirect Prompt Injection, dan Shadow MCP sebagai Kategori Risiko Utama Palo Alto Networks Menyelesaikan Akuisisi Portkey, Meluncurkan Prisma AIRS AI Gateway sebagai Agentic Control Plane arXiv: 'Plant, Persist, Trigger' — Sleeper Attack Research Formalises Cross-Interaction Agent Memory Poisoning as a Distinct Threat Class Kerentanan Deserialisasi LangChain Memungkinkan Remote Code Execution melalui Daftar Izin Objek yang Terlalu Luas — CVE-2026-44843 (CVSS 8.2)CVE-2026-41863: Filename yang Dipengaruhi LLM Mencapai Path.resolve Sebelum File Write di Spring AI Anthropic Skills API — Agentic Workflow Path Traversal Sandbox AI Agents Pemerintah Singapura: Indirect Prompt Injection yang Mengaktifkan RCE Dikonfirmasi sebagai Vektor Serangan Agentic Produksi Teratas Sandbox AI Agents Pemerintah Singapura–Google: Indirect Prompt Injection Diidentifikasi sebagai Risiko Keamanan Siber Utama dalam Penerapan Agentic Produksi Memperkenalkan RAMPART dan Clarity: Tools Open Source untuk Membawa Keamanan ke dalam Alur Kerja Pengembangan Agent Anthropic Diam-diam Patch Bypass Sandbox Kode Claude; Bypass Kedua dalam Lima Bulan, Tidak Ada CVE yang Dikeluarkan CVE-2026-45244: Ringkasan Ekstensi Browser Tanpa Otorisasi Memungkinkan Perebutan Otomasi Agentic melalui Konten Berbahaya Model Penjaga WARD Membela Agen Web Terhadap Injeksi Prompt dengan Recall Hampir Sempurna Ancaman AI Memperluas Permukaan Serangan di Pasar Emerging — Vektor Serangan Baru Melampaui Deteksi Signature Lyrie.ai Merilis Agent Trust Protocol (ATP)—Standar Terbuka Pertama untuk Verifikasi Kriptografi AI Agent Kerangka Kerja Heimdallr Mendeteksi Risiko Keamanan yang Diinduksi LLM dalam Alur Kerja GitHub CI Laporan Pentesting Cobalt: Sistem AI Menunjukkan Kepadatan Cacat Parah 2.5x Lebih Tinggi Dibanding Aplikasi Legacy Injeksi Prompt Tidak Langsung Gemini CLI Memungkinkan Kompromi Rantai Pasokan (CVSS 10.0)Kerentanan Batas Filesystem NanoClaw Container Agent Mengaktifkan Akses Baca/Tulis Host CISA dan Mitra Internasional Menerbitkan Penasihat Bersama tentang Penerapan AI Agentic yang Aman Kerentanan Eksekusi Perintah Sistemik dalam Model Context Protocol STDIO Transport Mempengaruhi 200.000 Server AI Agent Forcepoint Mengungkapkan 10 Payload Indirect Prompt Injection In-the-Wild yang Menargetkan AI Agents OpenAI Merilis Model Privacy Filter untuk Deteksi dan Redaksi PII Kerentanan Sandbox Escape pada Google Antigravity AI Agent Manager 'Comment and Control': Injeksi Prompt via Komentar GitHub Membahayakan Claude Code, Gemini CLI, dan GitHub Copilot ShareLeak / PipeLeak: Microsoft Copilot Studio dan Salesforce Agentforce yang Sudah Dipatch Masih Melakukan Exfiltration Data via Prompt Injection Prompt Injection: Risiko LLM #1 OWASP Terus Meningkat di 2026 Google DeepMind Memetakan Enam Kategori Perangkap Agen AI Berbasis Web Google DeepMind Menerbitkan Taksonomi 'AI Agent Traps': Enam Kategori Serangan Terhadap Agen Otonom Inisiatif Standar AI Agent NIST Dimulai dengan Sesi Mendengarkan April Laporan CIS: Prompt Injections — Ancaman Inheren terhadap Generative AI Keracunan Tool Protokol MCP melalui Registrasi Server Berbahaya

Referensi

OWASP Top 10 for LLM Applications — LLM01: Prompt Injection NIST CSRC Glossary: Prompt Injection

Pantau di umpan langsung Lihat bagaimana hal ini terwujud dalam perkembangan keamanan dan tata kelola AI nyata.