Apa yang terjadi
Tiga kerentanan terpisah dipublikasikan untuk Docling pada 2026-06-24. CVE-2026-44016 (CVSS 8.2): optional Playwright HTML renderer mengambil URL yang dikontrol penyerang di sisi server tanpa perlindungan SSRF. CVE-2026-44017 (CVSS 7.5): download model EasyOCR mengekstrak arsip ZIP tanpa validasi jalur, memungkinkan path traversal write. CVE-2026-44020 (CVSS 7.5): parser XML paten USPTO menggunakan xml.sax.parseString() tanpa perlindungan XXE, memungkinkan pembacaan file dan SSRF dari XML berbahaya.
Mengapa penting
Docling adalah perpustakaan pemrosesan dokumen unggulan IBM untuk AI generatif dan pipeline RAG, dengan integrasi di seluruh ekosistem AI. Dokumen yang dicerna ke sistem RAG pada dasarnya tidak terpercaya; bug ini memungkinkan dokumen berbahaya keluar dari sandbox parsing, membaca file server, menjangkau jaringan internal, atau menimpa file model — mengubah pipeline penyerapan RAG menjadi vektor serangan.
Vektor serangan
(CVE-2026-44016) Dokumen HTML berbahaya memicu SSRF melalui renderer berbasis Playwright saat backend HTML diaktifkan; (CVE-2026-44017) Arsip ZIP model EasyOCR yang dikompromikan mengekstrak file di luar direktori target (Zip Slip); (CVE-2026-44020) Dokumen XML paten USPTO yang dirancang memanfaatkan XXE untuk membaca file lokal atau melakukan SSRF
Sistem yang terdampak
Docling: CVE-2026-44016 memengaruhi 2.82.0–2.90.x; CVE-2026-44017 memengaruhi < 2.91.0; CVE-2026-44020 memengaruhi 2.13.0–2.73.x
Mitigasi
Tingkatkan ke Docling 2.91.0 untuk ketiga CVE. Rilis: https://github.com/docling-project/docling/releases/tag/v2.91.0 ; Pemberitahuan XXE: https://github.com/docling-project/docling/security/advisories/GHSA-m88r-rg27-5xfg