Kerentanan  ·  2026-06-21

vLLM Sparse Tensor Validation Hilang dalam Embeddings Multimodal — Denial of Service

KerentananHigh dampakGlobalCVE-2026-56340
CVE-2026-56340 dipublikasikan ke NVD pada 2026-06-20 (CVSS 8.8 Tinggi). Versi vLLM 0.10.2 hingga 0.12.x kehilangan validasi input untuk indeks tensor sparse dalam pipeline pemrosesan embeddings multimodal mereka. Konfigurasi default PyTorch menonaktifkan pemeriksaan invariant tensor sparse untuk kinerja, jadi tensor yang dirancang dengan indeks negatif atau di luar batas melewati pemrosesan tanpa terdeteksi, menghancurkan server. Perbaikan di vLLM 0.13.0 menambahkan validasi eksplisit sebelum operasi tensor sparse.
vLLM adalah mesin inferensi LLM sumber terbuka dominan yang digunakan dalam penerapan AI produksi. Penyerang tanpa autentikasi yang dapat mengirimkan permintaan embedding ke endpoint vLLM multimodal dapat menghancurkan server inferensi dengan satu permintaan yang salah bentuk, menyebabkan denial-of-service lengkap bagi semua pengguna penerapan tersebut. Dalam lingkungan inferensi GPU multi-penyewa, ini juga mempengaruhi penyewa lain yang berbagi server yang sama.
Penyerang mengirimkan permintaan embedding yang dirancang yang berisi tensor sparse yang salah bentuk dengan indeks negatif atau di luar batas. Karena PyTorch menonaktifkan pemeriksaan invariant tensor sparse secara default dan vLLM melakukan validasi sebelum pemrosesan, tensor yang salah bentuk memicu perilaku yang tidak terdefinisi/crash dalam jalur pemrosesan embeddings multimodal, menyebabkan denial-of-service ke server inferensi
vLLM >= 0.10.2 dan < 0.13.0
Tingkatkan vLLM ke versi 0.13.0 atau lebih baru. Penasihat: https://github.com/vllm-project/vllm/security/advisories/GHSA-mcmc-2m55-j8jj
Sumber
NVD CVE-2026-56340GitHub Advisory GHSA-mcmc-2m55-j8jj (vLLM)Vulnerability-Lookup CVE-2026-56340
Lihat di umpan langsung Jelajahi temuan keamanan dan tata kelola AI terkait — diperbarui setiap pagi.
Buka umpan →