2014-02-25 58 views
1

我正在使用PDFBox並具有以下代碼片段,它正在讀取PDF文件並將其轉換爲圖像(PNG)。它運行良好,唯一的問題是它完全丟失了PDF文件中的條形碼值。PDFBox - PDF到圖像丟失條碼

有誰知道如何解決這個PDFBox?這甚至有可能嗎?謝謝。

PDDocument doc = PDDocument.load(new File("INPUT.pdf")); 
PDPage page = (PDPage) doc.getDocumentCatalog().getAllPages().get(0); 
BufferedImage image = page.convertToImage(); 
File outputfile = new File("image.png"); 
ImageIO.write(image, "png", outputfile); 
+0

請提供有問題的pdf。這就是說,PDFBox轉換爲圖像不支持所有pdf功能。因此,預計會出現一定的損失。 – mkl

+0

我有過相同的經歷。這是一個很好的問題。必須有一種方法可以用PDFBox做到這一點...或者,在將PDF轉換爲圖像時,它只能複製文本(而不是任何類型的圖像)?似乎沒有意義 – mmcrae

+0

看來JPedal可能能夠做得比PDFBox更好當前http://stackoverflow.com/questions/22332791/converting-pdf-to-image-with-proper-formatting(OP自己接受答案使用JPedal) – mmcrae

回答

0

條形碼圖像的格式不能被pdfbox識別。 你缺少這樣的一些可選的擴展:

  • 閱讀JBIG2圖片:JBIG2 ImageIO的或JBIG2 - 圖片 - 解碼
  • 閱讀JPEG 2000(JPX)圖片:JAI圖像I/O工具核心

More information here