기술 설명
NVIDIA TensorRT-LLM (TRT-LLM)의 세 가지 안전하지 않은 역직렬화 취약점이 2026년 5월 20일에 NVD에 공개되었습니다. CVE-2025-33255 (CVSS 7.5 High)는 MPI 서버 구성 요소에 영향을 미치고, CVE-2026-24163 (CVSS 7.5 High)는 RPC 테스팅에 영향을 미치며, CVE-2026-24142 (CVSS 6.3 Medium)는 역직렬화 및 안전하지 않은 직렬화된 핸들과 관련이 있습니다. 세 취약점 모두 공격자가 안전하지 않은 역직렬화를 유발할 수 있으며, 잠재적으로 코드 실행, 서비스 거부, 데이터 변조 및 정보 공개로 이어질 수 있습니다. TRT-LLM은 최적화된 대규모 언어 모델 추론을 위한 NVIDIA의 광범위하게 배포된 라이브러리로, 프로덕션 LLM 서빙 환경에서 사용됩니다. 취약점은 NVD 설명에 따라 '모든 플랫폼'에 영향을 미칩니다.
공격 경로
TRT-LLM MPI 서버 또는 RPC 테스팅 인터페이스에 도달할 수 있는 공격자는 악의적으로 조작된 직렬화된 데이터를 전송하여 안전하지 않은 역직렬화를 유발할 수 있습니다. 성공적인 악용은 TRT-LLM 프로세스의 컨텍스트에서 임의의 코드를 실행하고, 모델 출력이나 구성을 변조하며, 서비스 거부를 일으키거나 민감한 정보 (모델 가중치, 추론 데이터, 자격 증명)를 공개할 수 있습니다. 공격 표면은 TRT-LLM 배포 방식에 따라 다릅니다: 클라우드 호스팅 LLM 서빙 엔드포인트, 온프레미스 추론 서버, 에지 AI 배포 또는 연구 클러스터. TRT-LLM 서비스가 신뢰할 수 없는 네트워크에 노출되거나 사용자가 제공한 직렬화된 입력을 수락하는 경우 악용 위험이 높아집니다.
영향받는 시스템
클라우드 LLM 서빙 플랫폼, 온프레미스 AI 인프라, 에지 AI 배포 및 연구 환경을 포함하여 LLM 추론을 위해 NVIDIA TensorRT-LLM을 사용하는 모든 배포. TRT-LLM을 프로덕션 모델 서빙 (예: 고객 대면 챗봇, 내부 AI 에이전트, 코드 생성 서비스)에 사용하는 조직은 이를 중대한 취약점으로 취급해야 합니다. AI 인프라 팀은 TRT-LLM 서비스가 네트워크에 접근 가능한지 여부, 신뢰할 수 없는 소스의 직렬화된 입력을 수락하는지 여부, 그리고 TRT-LLM 프로세스가 실행되는 권한 수준을 감사해야 합니다.
완화 방안
2026년 5월 20일 현재 NVIDIA는 NVD 레코드에 패치 세부 사항을 아직 공개하지 않았습니다. 조직은 패치 및 해결 방법에 대해 NVIDIA 보안 공지를 모니터링해야 합니다. 임시 완화 방안: TRT-LLM MPI 및 RPC 인터페이스에 대한 네트워크 액세스 제한 (방화벽 규칙, 네트워크 분할), TRT-LLM에 전달하기 전에 직렬화된 입력 검증 및 정제, 최소 권한 서비스 계정으로 TRT-LLM 프로세스 실행, 비정상적인 역직렬화 동작을 감지하기 위한 런타임 모니터링 구현. 프로덕션 LLM 서빙의 경우 추론 계층에 도달하기 전에 요청을 검증하고 필터링하는 API 게이트웨이 뒤에 TRT-LLM을 배치하는 것을 고려하세요.