2013-08-30 30 views
3

我正在使用Apache PDFbox處理我的PDF。我需要提取文本以及PDF中每個字符的字體信息以進一步處理它我使用了processTextPosition(TextPosition文本)方法來獲取文本及其字體信息。但我無法讀取像單引號,雙引號以及其中一些字符的字符。我檢查了PDF的流內容。它對這些單引號和雙引號以及它周圍的字符有一些數字表示,因爲它在正常情況下具有實際字符......任何人都可以幫助我解決這個問題。無法讀取PDFBOX中的單引號和雙引號字符及其中的一些字符

回答

相關問題