2012-10-25 15 views
3

我需要編寫一個程序,它可以找到PDF文檔中最大的文本(可能是標題!),我試過使用Tika作爲解析器,但是我無法找到一種獲取字體大小的方法。此外,Tika圖書館似乎對我的使用而言過於強大和複雜。 有沒有更簡單的方法/庫,我可以使用?不使用庫和自己解析PDF更容易或更好(我對這種方法感興趣)?如果是這樣,我應該從哪裏開始?解析Java中PDF文件的字體大小

任何信息,非常感謝。

回答

1

我在SO上發現了this方法,它在PDFBox庫中覆蓋了processTextPositionPDFTextStripper並提取字體大小。我以前沒有看到它,因爲這個帖子的問題有點不同。