0
我有一個項目,我必須從PDF文件(而不是metaData)中獲得標題,作者信息。所以我嘗試從給定的座標讀取PDF文本,並嘗試獲取文本的字體。Pdf文本座標/字體
有沒有辦法做到這一點,任何人都可以提供建議?還是有另一種解決方案來做我的項目?
感謝您與我分享的每一個幫助和想法。
我有一個項目,我必須從PDF文件(而不是metaData)中獲得標題,作者信息。所以我嘗試從給定的座標讀取PDF文本,並嘗試獲取文本的字體。Pdf文本座標/字體
有沒有辦法做到這一點,任何人都可以提供建議?還是有另一種解決方案來做我的項目?
感謝您與我分享的每一個幫助和想法。
有多個用於Java的PDF庫,允許您提取文本,我最喜歡的文本是iText,作爲文本解析的示例,請參閱iText in Action第2版的第15章的ExtractPageContentArea和其他examples。
目前沒有使用字體信息的例子,但是信息可用於RenderListeners。