2012-04-04 16 views
1

我們需要集成到現有的Java Web應用程序中,這是一個允許用戶比較2個pdf文檔並查看差異的新功能。所以,我開始搜索一些已經存在的庫或工具(開源或商業),可以幫助我解決這個問題。 有誰知道是否存在這種應用?這將需要2 PDF,比較它們並顯示差異?基於Web的應用程序,用於比較2個pdf文檔

由於提前, Madalina

+0

這樣的工具確實存在 - 問題在於你究竟是什麼意思的差異。你想知道文本是不同的嗎?如果文本的格式不同?如果一個元素(文本或圖像)在不同的地方?如果圖像中的像素不同?每種情況都有不同的方法。 – 2015-05-26 07:44:54

回答

0

我的回答可能不盡如人意,但來自Apache的項目 - > http://pdfbox.apache.org/

可以幫助ü。您可以將PDF文件轉換爲文本文件並進行比較。

0

你好,我提出建立在PDFBOX可以donwload從link

使用示例是下面提到它執行三個層次的比較,你可以簡單地通過節能目標和源文件名添加一個循環的源代碼的PDF比較項目一個列表,然後調用它的比較功能。

 pdfComparison cmp=new pdfComparison(); 
     //Text Comparision page by page   if(cmp.textComparision("ReferencePDF\\PDF2_302.pdf","C:\\\PDF2_305.pdf")) 
       { 
     System.out.print("\n********PDF text is identical******* "); 

       } 
       else 
       { 
        System.out.print("\n********PDF text is not identical******* "); 

       } 

//Extract all images in PDF and compare 
    cmp.extract_ALL_Images_ThenCompare("PDF2_302.pdf","PDF2_302.pdf"); 

//Convert Both PDF pages into JPG and perform image comparison 
     cmp.PDF_Convert_To_Jpeg_Comparision("PDF2_302.pdf","PDF2_302.pdf"); 

您會在項目中看到文件夾差異中的所有圖像差異。如果任何問題只是給我留言

+1

您的項目使用當前的PDFBox版本1.8.9。已知在版本2之前的PDFBox版本在將PDF頁面呈現爲當前2.0.0-SNAPSHOT中已修復的圖像時存在許多缺陷。因此,基於PDFBox 1.8.9的PDF比較可以作爲第一次煙霧測試,或者在PDFBox 1.8.9可以正確呈現的PDF的非常受控制的環境中工作,但不能用於通用PDF的生產代碼。 – mkl 2015-05-26 10:16:00

+0

我不是使用PDF框進行比較,我只是通過PDF框提取內容。請先下載代碼並檢查您的自我。 – fahad 2015-05-26 11:04:25

+0

其工作正常我的框架工作infact我比較300頁PDF – fahad 2015-05-26 11:05:28

相關問題