vLLM Sparse Tensor Validation Hilang dalam Embeddings Multimodal — Denial of Service

Apa yang terjadi

CVE-2026-56340 dipublikasikan ke NVD pada 2026-06-20 (CVSS 8.8 Tinggi). Versi vLLM 0.10.2 hingga 0.12.x kehilangan validasi input untuk indeks tensor sparse dalam pipeline pemrosesan embeddings multimodal mereka. Konfigurasi default PyTorch menonaktifkan pemeriksaan invariant tensor sparse untuk kinerja, jadi tensor yang dirancang dengan indeks negatif atau di luar batas melewati pemrosesan tanpa terdeteksi, menghancurkan server. Perbaikan di vLLM 0.13.0 menambahkan validasi eksplisit sebelum operasi tensor sparse.

Mengapa penting

vLLM adalah mesin inferensi LLM sumber terbuka dominan yang digunakan dalam penerapan AI produksi. Penyerang tanpa autentikasi yang dapat mengirimkan permintaan embedding ke endpoint vLLM multimodal dapat menghancurkan server inferensi dengan satu permintaan yang salah bentuk, menyebabkan denial-of-service lengkap bagi semua pengguna penerapan tersebut. Dalam lingkungan inferensi GPU multi-penyewa, ini juga mempengaruhi penyewa lain yang berbagi server yang sama.

Vektor serangan

Penyerang mengirimkan permintaan embedding yang dirancang yang berisi tensor sparse yang salah bentuk dengan indeks negatif atau di luar batas. Karena PyTorch menonaktifkan pemeriksaan invariant tensor sparse secara default dan vLLM melakukan validasi sebelum pemrosesan, tensor yang salah bentuk memicu perilaku yang tidak terdefinisi/crash dalam jalur pemrosesan embeddings multimodal, menyebabkan denial-of-service ke server inferensi

Sistem yang terdampak

vLLM >= 0.10.2 dan < 0.13.0

Mitigasi

Tingkatkan vLLM ke versi 0.13.0 atau lebih baru. Penasihat: https://github.com/vllm-project/vllm/security/advisories/GHSA-mcmc-2m55-j8jj