Kerentanan  ·  2026-06-12

vLLM CVE-2026-5497 — CVSS 7.5 Denial-of-Service Tanpa Autentikasi via Pemrosesan Frame Video Tanpa Batas dalam Server Inferensi AI yang Luas Digunakan

KerentananHigh dampakGlobalCVE-2026-5497
Versi vLLM 0.8.0 dan yang lebih baru rentan terhadap serangan Out-of-Memory Denial of Service dalam metode VideoMediaIO.load_base64(). Saat memproses URL data video/jpeg, metode membagi string data base64 pada koma untuk mengekstrak frame JPEG tanpa memberlakukan batasan jumlah frame apa pun. Penyerang dapat membuat satu permintaan API yang berisi ribuan frame JPEG base64 yang dipisahkan koma, menyebabkan server mendekode semua frame ke dalam memori hingga crash. Kerentanan dapat diakses melalui titik akhir API penyelesaian obrolan yang kompatibel dengan OpenAI tanpa autentikasi.
Satu permintaan HTTP tanpa autentikasi ke titik akhir vLLM /v1/chat/completions dengan URL data video/jpeg yang dirancang berisi ribuan frame JPEG berkode base64 yang dipisahkan koma. Tidak ada autentikasi yang diperlukan jika API terekspos tanpa lapisan auth (umum dalam penyebaran yang dihosting sendiri).
vLLM 0.8.0 dan semua versi yang lebih baru hingga setidaknya tanggal pengungkapan. vLLM adalah salah satu server inferensi LLM open-source yang paling banyak digunakan, digunakan untuk menghosting model termasuk Llama, Mistral, Qwen, dan lainnya di lingkungan enterprise dan cloud.
Terapkan patch dari commit 58ee614 dalam repositori vLLM. Jika patching segera tidak memungkinkan: letakkan titik akhir inferensi vLLM di belakang gateway API yang terauthentikasi, terapkan batasan ukuran permintaan dan validasi input sebelum URL data video mencapai proses vLLM, dan aktifkan pemantauan OOM untuk mendeteksi upaya serangan.
Sumber
NVD — CVE-2026-5497 DetailGitHub Security Advisory — GHSA-wcwg-c5fc-9vrc (vLLM OOM DoS)vLLM Patch Commit — 58ee614
Lihat di umpan langsung Jelajahi temuan keamanan dan tata kelola AI terkait — diperbarui setiap pagi.
Buka umpan →