Penjelasan teknis
Kerentanan denial-of-service mempengaruhi jalur serving kompatibel OpenAI di vLLM 0.19.0. Eksploit tersedia secara publik dan dapat diluncurkan dari jarak jauh. Sebagai server inferensi LLM open-source yang paling banyak digunakan — digunakan dalam produksi oleh perusahaan, platform AI, dan penyedia cloud — gangguan ketersediaan di vLLM berdampak langsung pada pengiriman layanan AI dan pipeline inferensi model.
Vektor serangan
Remote, tidak ada autentikasi yang dicatat dalam deskripsi NVD. Eksploit tersedia secara publik, menurunkan hambatan untuk serangan oportunistik terhadap endpoint API OpenAI-compatible vLLM yang terbuka.
Sistem yang terdampak
vLLM 0.19.0, jalur serving kompatibel OpenAI. vLLM banyak digunakan sebagai server inferensi LLM dalam penyebaran AI enterprise dan cloud.
Mitigasi
Periksa rilis vLLM yang diperbaiki untuk mengatasi CVE-2026-9540 dan tingkatkan dari 0.19.0. Sebagai kontrol interim, batasi akses jaringan ke endpoint API vLLM ke rentang IP terpercaya dan terapkan rate limiting pada jalur serving kompatibel OpenAI. Pantau volume permintaan anomali yang menargetkan endpoint inferensi.