vLLM Sparse Tensor Validation Missing in Multimodal Embeddings — Denial of Service

무슨 일이 있었나

CVE-2026-56340은 2026년 6월 20일 NVD에 게시되었습니다(CVSS 8.8 High). vLLM 버전 0.10.2에서 0.12.x까지는 다중 모달 임베딩 처리 파이프라인의 희소 텐서 인덱스에 대한 입력 검증이 누락되어 있습니다. PyTorch의 기본 구성은 성능상의 이유로 희소 텐서 불변성 검사를 비활성화하므로, 음수 또는 범위를 벗어난 인덱스가 있는 제작된 텐서는 처리되지 않고 감지되지 않아 서버가 충돌합니다. vLLM 0.13.0의 수정은 희소 텐서 연산 전에 명시적 검증을 추가합니다.

왜 중요한가

vLLM은 프로덕션 AI 배포에서 사용되는 지배적인 오픈소스 LLM 추론 엔진입니다. 다중 모달 vLLM 엔드포인트에 임베딩 요청을 제출할 수 있는 인증되지 않은 공격자는 단 하나의 잘못된 요청으로 추론 서버를 충돌시킬 수 있어 해당 배포의 모든 사용자에 대한 완전한 서비스 거부를 야기합니다. 다중 테넌트 GPU 추론 환경에서는 이것이 동일한 서버를 공유하는 다른 테넌트에게도 영향을 미칩니다.

공격 경로

공격자는 음수 또는 범위를 벗어난 인덱스가 있는 잘못된 희소 텐서를 포함하는 제작된 임베딩 요청을 제출합니다. PyTorch가 기본적으로 희소 텐서 불변성 검사를 비활성화하고 vLLM이 처리 전에 검증을 수행하지 않기 때문에, 잘못된 텐서는 다중 모달 임베딩 처리 경로에서 정의되지 않은/충돌 동작을 트리거하여 추론 서버에 대한 서비스 거부를 야기합니다.

영향받는 시스템

vLLM >= 0.10.2 and < 0.13.0

완화 방안

vLLM을 0.13.0 이상으로 업그레이드하세요. 권고: https://github.com/vllm-project/vllm/security/advisories/GHSA-mcmc-2m55-j8jj