Apa yang terjadi
Peneliti mengungkapkan pada 2026-06-15 (dilaporkan oleh CSO Online, dikonfirmasi melalui feed Manus yang mereferensikan https://www.csoonline.com/article/4185051/attackers-can-turn-ai-agent-guardrails-into-denial-of-service-weapons.html) sebuah kelas serangan baru di mana guardrail AI berbasis reasoning — yang dimaksudkan sebagai kontrol keamanan — dimanfaatkan sebagai vektor DoS. Dengan menyuntikkan satu dokumen beracun, penyerang menjebak sistem reasoning dalam loop pemikiran yang diperpanjang, memperlambat alur kerja agen bersama hingga 148× dan secara efektif menolak layanan ke infrastruktur.
Mengapa penting
Hal ini membalikkan asumsi keamanan: semakin mampu dan intensif reasoning guardrail, dampak DoS semakin buruk. Infrastruktur AI bersama (API LLM multi-tenant, platform agen enterprise) sangat terpapar karena satu input yang dikontrol penyerang dapat menurunkan layanan untuk semua pengguna. Ini adalah kelas serangan baru tanpa CVE yang ada, memerlukan mitigasi arsitektur (memisahkan infrastruktur guardrail dari compute agen, batas waktu pada kedalaman reasoning) yang belum diterapkan oleh sebagian besar deployment.
Vektor serangan
Penyerang menyuntikkan satu dokumen beracun yang dirancang khusus ke dalam aliran input agen. Dokumen memicu guardrail berbasis reasoning untuk memasuki loop pemikiran yang diperpanjang mengevaluasi konten yang ambigu, mengonsumsi sumber daya compute pada tingkat 148× normal dan secara efektif melumpuhkan infrastruktur agen bersama untuk semua pengguna bersamaan.
Sistem yang terdampak
Sistem guardrail agen AI berbasis reasoning (infrastruktur inferensi LLM bersama apa pun yang menggunakan extended thinking/reasoning untuk pemeriksaan keamanan)
Mitigasi
Pisahkan infrastruktur guardrail dari compute agen utama untuk membatasi radius ledakan. Terapkan batas kedalaman reasoning maksimum dan anggaran token pada model pemeriksaan keamanan. Pantau durasi reasoning anomali per permintaan. Referensi: https://www.csoonline.com/article/4185051/attackers-can-turn-ai-agent-guardrails-into-denial-of-service-weapons.html