是否有任何Java框架可以從PDF/A中提取文本?有很多java PDF框架,但是他們沒有指定,如果他們支持這種格式。從Java中的PDF/A中提取文本
2
A
回答
1
Leonard Rosenthol在itext峯會上就PDF標準和格式進行了精彩演講。他解釋了所有不同的子集。您可以在http://www.parleys.com/#st=5&id=3188&sl=0
1
您應該檢查http://itextpdf.com/(特別是this一章)。它是我用過的Java中使用PDF文件的最佳開源框架。
相關問題
- 1. 從Java中提取文本字符串
- 2. 從文本中提取名詞(Java)
- 3. 從字符串中提取文本Java
- 4. 從java中混合文本中提取阿拉伯文本
- 5. 如何提取從文本文件中的數據在Java中
- 6. 從java中的文本文件中提取短語
- 7. 從Webview中提取文本
- 8. 從HTML中提取文本
- 9. 從html中提取文本?
- 10. 從HTML中提取文本
- 11. 從WPF中提取文本
- 12. 從文本中提取
- 13. 從URL中提取文本
- 14. 在java中使用Apache Tika從PDF文件中提取文本
- 15. 的Java從文本中提取值的文件
- 16. 從Java中的WAV文件中提取樣本
- 17. 從Java中的文本中提取日期
- 18. 從Java中的文本變量中提取信息塊
- 19. 從文本文件中提取的URL
- 20. 使用java從文本文件中提取特定的url
- 21. 如何從Java中的XML文件提取所有PCDATA(文本)?
- 22. 從java中的JTextArea中讀取文本
- 23. Java從文本上的某個點提取文本文本
- 24. Java如何從文本文件中提取單詞?
- 25. 從文件在java中提取特定文本
- 26. Java從文本文件中提取隨機值
- 27. 從文本文件中提取URL
- 28. 從pdf文件中提取文本
- 29. 從xml文件中提取文本
- 30. 從文本中提取文件蟒蛇
所有的發言名單是不是PDF/PDF的只是一個子集在線觀看視頻?這並不意味着任何可以閱讀PDF的閱讀器都可以閱讀PDF/A,但是您可能需要特定支持來創建PDF/A(這不是您想要的),因爲它需要所有字體,色彩空間,等嵌入。 –
你是不是嘗試了tika?它在標籤中提到。 –
如果我理解pdf/a,它或多或少像圖像一樣保存?而其他pdf可以以簡單的格式顯示文本。 – Trind