Penjelasan teknis
Tiga kerentanan unsafe deserialization dalam NVIDIA TensorRT-LLM (TRT-LLM) dipublikasikan ke NVD pada 20 Mei 2026. CVE-2025-33255 (CVSS 7.5 High) mempengaruhi komponen MPI server; CVE-2026-24163 (CVSS 7.5 High) mempengaruhi RPC testing; CVE-2026-24142 (CVSS 6.3 Medium) melibatkan deserialization dan unsafe serialized handles. Ketiga kerentanan tersebut memungkinkan penyerang untuk menyebabkan unsafe deserialization, yang berpotensi mengarah pada eksekusi kode, denial of service, manipulasi data, dan pengungkapan informasi. TRT-LLM adalah library NVIDIA yang tersebar luas untuk optimized large language model inference, digunakan dalam production LLM serving environments. Kerentanan mempengaruhi 'any platform' menurut deskripsi NVD.
Vektor serangan
Penyerang yang dapat menjangkau TRT-LLM MPI server atau RPC testing interface dapat mengirim serialized data yang dirancang dengan jahat untuk memicu unsafe deserialization. Eksploitasi yang berhasil dapat mengeksekusi arbitrary code dalam konteks TRT-LLM process, memanipulasi model outputs atau configuration, menyebabkan denial of service, atau mengungkapkan informasi sensitif (model weights, inference data, credentials). Attack surface tergantung pada cara TRT-LLM digunakan: cloud-hosted LLM serving endpoints, on-premises inference servers, edge AI deployments, atau research clusters. Jika layanan TRT-LLM terbuka ke jaringan yang tidak terpercaya atau menerima serialized input yang disuplai pengguna, risiko eksploitasi meningkat.
Sistem yang terdampak
Setiap deployment menggunakan NVIDIA TensorRT-LLM untuk LLM inference, termasuk cloud LLM serving platforms, on-premises AI infrastructure, edge AI deployments, dan research environments. Organisasi yang menggunakan TRT-LLM untuk production model serving (misalnya, customer-facing chatbots, internal AI agents, code-generation services) harus memperlakukan ini sebagai kerentanan kritis. Tim AI infrastructure harus mengaudit apakah layanan TRT-LLM dapat diakses dari jaringan, apakah mereka menerima serialized input dari sumber yang tidak terpercaya, dan pada privilege level berapa TRT-LLM process berjalan.
Mitigasi
NVIDIA belum mempublikasikan detail patch dalam catatan NVD per 20 Mei 2026. Organisasi harus memantau security bulletins NVIDIA untuk patches dan workarounds. Mitigasi sementara: batasi network access ke TRT-LLM MPI dan RPC interfaces (firewall rules, network segmentation), validasi dan sanitasi setiap serialized input sebelum melewatkan ke TRT-LLM, jalankan TRT-LLM processes dengan least-privilege service accounts, dan implementasikan runtime monitoring untuk mendeteksi anomalous deserialization behavior. Untuk production LLM serving, pertimbangkan untuk menempatkan TRT-LLM di belakang API gateways yang memvalidasi dan memfilter requests sebelum mencapai inference layer.