2012-12-26 47 views
1

iText的API細節我要去工作在一個案例研究,在那裏我有一個要求,確保符合一定標準的PDF(例如,您在PDF中的內容是否是特定的字體,字號,標誌的位置) 。所以我只想確認是否使用iTEXT我可以獲得這些PDF規格?如果是,那麼iTEXT使用的API是做什麼用的?爲PDF驗證

注意:市場上有沒有其他工具可以實現這種功能?

回答

2

由於iText的,您可以直接訪問所有的PDF對象(字典,數組,流...),它爲您提供您所需的工具。但不要低估你的任務。根據你必須檢查的標準,你可能會有很多工作要做。

E.g.如果您的條件包括所有文本都必須使用單個給定字體,則可以簡單地解析整個文檔文本並檢查字體。另一方面,如果你必須區分例如標題和標準文本,您需要爲此引入一些啓發式方法,因爲通常標題未標記爲標題。

您的支票要多好?如果字體字典具有所需的名稱條目,或者您確實需要檢查字體(可能是嵌入的字體子集)的確是所需的字體,那麼這樣做足夠嗎?

您提到了一個徽標位置。您如何識別徽標(與其他圖紙或圖像相比)?

...

因此,iText的可以作爲一個基礎,但你必須事先做思想頗多。如果您決定認真使用iText,我建議您諮詢iText in Action — 2nd Edition

還有其他的PDF庫和工具可用,也都免費的(無論是作爲免費啤酒或在自由speach)和商業,其中提供PDF分析的框架。我主要使用iText,因此不會深入瞭解其他的。

Ceterum censeo,您應該明確看看PDF規範ISO 32000-1:2008(尤其是圖形和文本的第8章和第9章),以便了解PDF包含哪些內容以及哪些不包含內容。