2016-08-03 41 views
1

在Java中,我希望能夠讀取PDF文件,測試它是否符合PDF/A(PDF for Archiving),如果不符合,則轉換文件爲PDF/A。如何將PDF轉換爲Java中的PDF/A

我可能更喜歡這在Apache PDFBox中,因爲我已經在API中做了一些事情,但我也會對其他API開放。

+0

你想轉換哪種PDF/A口味?有些人很難像@Tilman的回答所解釋的那樣,其他人則更加困難,尤其是如果不需要人爲幫助的話...... – mkl

回答

4

測試PDF文件是否可以使用PDFBox預檢完成PDF/A-1b,請參閱示例here或使用預檢應用程序。

創建工具將文件從PDF轉換爲PDF/A是一項艱鉅的任務,需要數月甚至數年的時間。如果您查看PDFBox預檢的源代碼,您會發現數百條錯誤消息。所以你的工具必須能夠修復這些錯誤。有些是:

  • 非嵌入字體
  • 色彩的運用,而不輸出意向
  • 不當元數據
  • JBIG2編碼的圖像
  • LZW編碼數據

只是檢查幾個您使用PDFBox預檢自己的文件,並且您會看到各種各樣的問題...

如果您沒有月份或年份,請訪問Callas Software GmbHPDF Tools AG的主頁購買此類轉換器。

+0

我想要第二個Tilman。這個問題不僅涉及技術步驟,還涉及確保對PDF和PDF/A規範有很好的理解。關於如何閱讀和解釋在他們的工具中反映的不同廠商同意的規格,有幾次討論。雖然您可以使用PDFBox來構建轉換,但購買和建立轉換器可能更具成本效益。請記住,將任意PDF轉換爲PDF/A並不總是可能的 –