무슨 일이 있었나
2026-06-24에 Docling에 대해 세 가지 별도 취약점이 공개되었습니다. CVE-2026-44016 (CVSS 8.2): 선택적 Playwright HTML 렌더러가 SSRF 보호 없이 서버측에서 공격자 제어 URL을 가져옵니다. CVE-2026-44017 (CVSS 7.5): EasyOCR 모델 다운로드가 경로 검증 없이 ZIP 아카이브를 추출하여 경로 순회 작성을 가능하게 합니다. CVE-2026-44020 (CVSS 7.5): USPTO 특허 XML 파서가 XXE 보호 없이 xml.sax.parseString()을 사용하여 악의적 XML에서 파일 읽기 및 SSRF를 허용합니다.
왜 중요한가
Docling은 생성형 AI 및 RAG 파이프라인을 위한 IBM의 주력 문서 처리 라이브러리이며, AI 생태계 전반의 통합이 있습니다. RAG 시스템에 수집된 문서는 본질적으로 신뢰할 수 없으므로, 이 버그들은 악의적 문서가 파싱 샌드박스를 벗어나고, 서버 파일을 읽으며, 내부 네트워크에 도달하거나, 모델 파일을 덮어쓸 수 있게 하여 RAG 수집 파이프라인을 공격 벡터로 변환합니다.
공격 경로
(CVE-2026-44016) 악의적 HTML 문서가 HTML 백엔드가 활성화될 때 Playwright 기반 렌더러를 통해 SSRF를 트리거함; (CVE-2026-44017) 손상된 EasyOCR 모델 ZIP 아카이브가 대상 디렉터리 밖으로 파일을 추출함(Zip Slip); (CVE-2026-44020) 조작된 USPTO 특허 XML 문서가 XXE를 악용하여 로컬 파일을 읽거나 SSRF를 수행함
영향받는 시스템
Docling: CVE-2026-44016은 2.82.0–2.90.x에 영향을 미침; CVE-2026-44017은 < 2.91.0에 영향을 미침; CVE-2026-44020은 2.13.0–2.73.x에 영향을 미침
완화 방안
세 CVE 모두에 대해 Docling 2.91.0으로 업그레이드하세요. 릴리스: https://github.com/docling-project/docling/releases/tag/v2.91.0 ; XXE 권고사항: https://github.com/docling-project/docling/security/advisories/GHSA-m88r-rg27-5xfg