Pedoman  ·  2026-06-06

Pembaruan Tim Merah AI Microsoft Taksonomi Mode Kegagalan Agentic AI — 7 Mode Baru dari 12 Bulan Red Teaming Produksi

PedomanHigh dampakGlobal
Tim Merah AI Microsoft menerbitkan taksonomi kegagalan mode yang diperbarui dalam sistem AI agentic pada 4 Juni, menambahkan tujuh kategori baru yang berasal dari satu tahun keterlibatan tim merah terhadap penerapan produksi termasuk Microsoft Security Copilot dan ekosistem MCP. Kategori baru tersebut adalah: agentic supply-chain compromise, goal hijacking, inter-agent trust escalation, computer-use agent visual attacks, session context contamination, MCP/plugin abuse, dan capability/architecture disclosure. Postingan tersebut menjelaskan bagaimana kerangka kerja agentic sumber terbuka (OpenClaw) dengan cepat mengumpulkan ribuan penerapan sambil menyimpan 336 plugin berbahaya yang terkonfirmasi — mengilustrasikan bagaimana ekosistem agen dapat berkembang lebih cepat daripada tinjauan keamanan.
Berbeda dengan edisi pertama 2025 (yang bersifat prospektif), pembaruan ini didasarkan pada rantai eksploitasi yang terkonfirmasi dalam produksi: zero-click data exfiltration dan lateral movement didokumentasikan dari input asal eksternal saja, tanpa interaksi pengguna selain penerapan agen awal. Bypass human-in-the-loop diidentifikasi sebagai mode kegagalan yang paling dieksploitasi, secara langsung menantang asumsi bahwa prompt persetujuan memberikan keamanan yang bermakna. Microsoft merekomendasikan pembuatan agent SBOM, verifikasi identitas per-task, dan scoping least-privilege per tool call.
Petakan tujuh mode kegagalan baru ke arsitektur agen yang diterapkan; secara khusus audit apakah prompt persetujuan manusia dapat dilewati dan apakah registri MCP/plugin telah ditinjau untuk entri berbahaya.
Sumber
Microsoft Security Blog — Updating the Taxonomy of Failure Modes in Agentic AI Systems
Lihat di umpan langsung Jelajahi temuan keamanan dan tata kelola AI terkait — diperbarui setiap pagi.
Buka umpan →