事件经过
在 vLLM 0.23.1rc0 之前,/v1/audio/transcriptions 端点限制压缩上传大小,但不限制解码的 PCM 输出。25 MB OPUS 文件在解码时扩展到大约 14.9 GB 的 float32 PCM。这导致推理服务器上的内存耗尽和拒绝服务。CVSS 6.5 中等,发布于 2026-06-22。
影响分析
任何公开音频转录的 vLLM 部署都可以通过单个包含精心设计的 OPUS 文件的无身份验证请求离线,中断该实例提供的所有 LLM 推理。这对生产多模态 AI 服务的影响尤为重大。
攻击途径
POST 精心设计的 25 MB OPUS 文件到 /v1/audio/transcriptions;服务器解码到 ~14.9 GB PCM 耗尽内存
受影响系统
vLLM 0.x 至 < 0.23.1rc0,启用了音频转录
缓解措施
升级到 vLLM 0.23.1rc0 或更高版本。PR 修复:https://github.com/vllm-project/vllm/pull/44970