Pembaruan Tim Merah AI Microsoft Taksonomi Mode Kegagalan Agentic AI — 7 Mode Baru dari 12 Bulan Red Teaming Produksi

Apa yang terjadi

Tim Merah AI Microsoft menerbitkan taksonomi kegagalan mode yang diperbarui dalam sistem AI agentic pada 4 Juni, menambahkan tujuh kategori baru yang berasal dari satu tahun keterlibatan tim merah terhadap penerapan produksi termasuk Microsoft Security Copilot dan ekosistem MCP. Kategori baru tersebut adalah: agentic supply-chain compromise, goal hijacking, inter-agent trust escalation, computer-use agent visual attacks, session context contamination, MCP/plugin abuse, dan capability/architecture disclosure. Postingan tersebut menjelaskan bagaimana kerangka kerja agentic sumber terbuka (OpenClaw) dengan cepat mengumpulkan ribuan penerapan sambil menyimpan 336 plugin berbahaya yang terkonfirmasi — mengilustrasikan bagaimana ekosistem agen dapat berkembang lebih cepat daripada tinjauan keamanan.

Mengapa penting

Berbeda dengan edisi pertama 2025 (yang bersifat prospektif), pembaruan ini didasarkan pada rantai eksploitasi yang terkonfirmasi dalam produksi: zero-click data exfiltration dan lateral movement didokumentasikan dari input asal eksternal saja, tanpa interaksi pengguna selain penerapan agen awal. Bypass human-in-the-loop diidentifikasi sebagai mode kegagalan yang paling dieksploitasi, secara langsung menantang asumsi bahwa prompt persetujuan memberikan keamanan yang bermakna. Microsoft merekomendasikan pembuatan agent SBOM, verifikasi identitas per-task, dan scoping least-privilege per tool call.

Tindakan yang diperlukan

Petakan tujuh mode kegagalan baru ke arsitektur agen yang diterapkan; secara khusus audit apakah prompt persetujuan manusia dapat dilewati dan apakah registri MCP/plugin telah ditinjau untuk entri berbahaya.