Apa yang terjadi
Docling sebelum 2.94.0 memiliki penanganan URI dan jalur yang tidak aman di backend HTML-nya (CVE-2026-47214, CVSS 7.1). Isu kedua (CVE-2026-44018, CVSS 5.5) di backend METS-GBS memungkinkan serangan XXE melalui file arsip berbahaya. Keduanya diperbaiki dalam rilis terbaru dan mewakili vektor serangan melalui lapisan penyerapan dokumen pipeline GenAI.
Mengapa penting
Docling adalah perpustakaan pemrosesan dokumen kunci untuk aplikasi GenAI, menguraikan dokumen untuk pipeline RAG dan konteks LLM. Dokumen berbahaya yang dikirim ke pipeline penyerapan yang didukung Docling dapat memanfaatkan cacat ini untuk membaca file server, memicu SSRF, atau melakukan serangan XXE — mengubah jalur penyerapan dokumen menjadi vektor serangan jarak jauh terhadap infrastruktur AI.
Vektor serangan
Backend HTML di Docling melakukan penanganan URI dan jalur yang tidak aman saat memproses dokumen HTML. File HTML yang dirancang dengan buruk yang disuplai ke pemroses dokumen dapat memanfaatkan ini untuk mengakses file atau sumber daya di luar cakupan pemrosesan yang dimaksudkan, berpotensi mengaktifkan path traversal atau SSRF dalam pipeline penyerapan dokumen.
Sistem yang terdampak
Docling < 2.94.0
Mitigasi
Tingkatkan ke Docling 2.94.0. Lihat: https://github.com/docling-project/docling/releases/tag/v2.94.0