Apa yang terjadi
Tim Merah AI Microsoft menerbitkan taksonomi kegagalan mode yang diperbarui dalam sistem AI agentic pada 4 Juni, menambahkan tujuh kategori baru yang berasal dari satu tahun keterlibatan tim merah terhadap penerapan produksi termasuk Microsoft Security Copilot dan ekosistem MCP. Kategori baru tersebut adalah: agentic supply-chain compromise, goal hijacking, inter-agent trust escalation, computer-use agent visual attacks, session context contamination, MCP/plugin abuse, dan capability/architecture disclosure. Postingan tersebut menjelaskan bagaimana kerangka kerja agentic sumber terbuka (OpenClaw) dengan cepat mengumpulkan ribuan penerapan sambil menyimpan 336 plugin berbahaya yang terkonfirmasi — mengilustrasikan bagaimana ekosistem agen dapat berkembang lebih cepat daripada tinjauan keamanan.
Mengapa penting
Berbeda dengan edisi pertama 2025 (yang bersifat prospektif), pembaruan ini didasarkan pada rantai eksploitasi yang terkonfirmasi dalam produksi: zero-click data exfiltration dan lateral movement didokumentasikan dari input asal eksternal saja, tanpa interaksi pengguna selain penerapan agen awal. Bypass human-in-the-loop diidentifikasi sebagai mode kegagalan yang paling dieksploitasi, secara langsung menantang asumsi bahwa prompt persetujuan memberikan keamanan yang bermakna. Microsoft merekomendasikan pembuatan agent SBOM, verifikasi identitas per-task, dan scoping least-privilege per tool call.
Tindakan yang diperlukan
Petakan tujuh mode kegagalan baru ke arsitektur agen yang diterapkan; secara khusus audit apakah prompt persetujuan manusia dapat dilewati dan apakah registri MCP/plugin telah ditinjau untuk entri berbahaya.