vLLM マルチモーダル埋め込みのスパーステンソル検証欠落 — サービス拒否

何が起きたか

CVE-2026-56340は2026年6月20日にNVDに公開されました（CVSS 8.8 High）。vLLMバージョン0.10.2～0.12.xは、マルチモーダル埋め込み処理パイプラインでスパーステンソルインデックスの入力検証を欠いています。PyTorchのデフォルト構成はパフォーマンスのためスパーステンソル不変チェックを無効にするため、負またははみ出したインデックスを持つ細工されたテンソルは検出されずに処理に通過し、サーバーをクラッシュさせます。vLLM 0.13.0の修正は、スパーステンソル操作の前に明示的検証を追加します。

なぜ重要か

vLLMは、本番AIデプロイメントで使用される支配的なオープンソースLLM推論エンジンです。マルチモーダルvLLMエンドポイントに埋め込みリクエストを送信できる認証されていない攻撃者は、単一の形式不良リクエストで推論サーバーをクラッシュさせ、そのデプロイメントのすべてのユーザーに対する完全なサービス拒否を引き起こすことができます。マルチテナントGPU推論環境では、同じサーバーを共有する他のテナントも影響を受けます。

攻撃経路

攻撃者は、負またははみ出したインデックスを持つ形式不良スパーステンソルを含む細工された埋め込みリクエストを送信します。PyTorchはデフォルトではスパーステンソル不変チェックを無効にし、vLLMは処理前に検証を実行しないため、形式不良テンソルはマルチモーダル埋め込み処理パスで未定義/クラッシュ動作をトリガーし、推論サーバーへのサービス拒否を引き起こします。

影響を受けるシステム

vLLM >= 0.10.2 and < 0.13.0

緩和策

vLLMをバージョン0.13.0以降にアップグレードしてください。アドバイザリ：https://github.com/vllm-project/vllm/security/advisories/GHSA-mcmc-2m55-j8jj