2011-03-29 51 views
1

可能重複:
Export PDF pages to a series of images in Java開源庫爲PDF格式的圖像轉換

請建議可用於PDF文件的圖像轉換一些好的Java庫。 我試過使用PDFBox:http://pdfbox.apache.org/,但在轉換成圖像後,我的pdf文檔中的大部分文本在圖像中出現亂碼。它將'T'看作'Y','C'看作'#'等等。

以下是代碼片段我用相同的:

PDDocument document = null; 
document = PDDocument.load(pdfFile); 
List pages = document.getDocumentCatalog().getAllPages(); 
for(int i=startPage-1; i<endPage && i<pages.size(); i++) 
{ 
    try 
    { 
    PDPage page = (PDPage)pages.get(i); 
    BufferedImage image = page.convertToImage(); 
    } 
} 
document.close(); 

我想這是有些問題,他們有渲染字體。 如果你覺得我可能在使用PDFBox時遺漏了某些東西,請告訴我。

請建議任何其他的替代方案。

我已經嘗試使用jPedal:http://www.jpedal.org/它工作得很好,但它不是免費的,所以請建議所有關於此的好替代品。

回答