是否有single Java文本解析器可以用來解析Office(windows)文檔,OpenOffice文檔和PDF嗎?否則,我是否需要使用Apache POI for Word文檔和其他OpenOffice和PDF庫?如果是的話,OpenOffice和PDFs的最佳選擇是什麼?開源的Java文本解析器
回答
如果任務正在閱讀PDF文檔,iText是您最好的選擇。 對於基於Microsoft Office和OpenOffice(LibreOffice)的文檔,POI將是我的解決方案。
但iText不是免費的嗎? – Izza
它的免費條款,你應該釋放使用itex api的應用程序的來源。從網站上跳過...... 「只要您開發涉及iText軟件的商業活動,就不用公開您的應用程序的源代碼,就必須購買此類許可證。」 http://itextpdf.com/terms-of -use/index.php –
POI無法讀取基於OpenOffice(LibreOffice)的文檔AFAIK。 PDF Box是可以閱讀PDF文檔的Apache替代方案。 – JasonPlutext
- 1. 開源ANSI C99解析器?
- 2. 開源XML解析器
- 3. C#開源NMEA解析器
- 4. Java源代碼解析器
- 5. 解析文本Java
- 6. Java解析器文件文本
- 7. 開源Matroska容器Silverlight MediaStreamSource解析器?
- 8. 好的開源SQL解析器?
- 9. C++中的開源DXF解析器
- 10. 解析文本文件Java
- 11. Java文本編輯器/解析框架
- 12. Java中的RSS源解析器庫
- 13. Ruby中的Java源代碼解析器
- 14. 在Java中有沒有好的開源EDIFACT解析器?
- 15. 用於Java的開源ABNF解析器實現?
- 16. 文本解析器
- 17. 是否有用於解析Excel 2007文件的Java開源庫?
- 18. 可可開源XML解析器
- 19. 開源數學表達式解析器?
- 20. 從PDF解析文本Java
- 21. PHP:解析RSS源的文本?
- 22. 解析特定的文本文件java
- 23. jQuery文本解析器
- 24. 文本塊解析器
- 25. 文本必須以'{'錯誤解析Java中的JSON開頭
- 26. TBXML解析器解析一個RSS源
- 27. 使用Java解析器從Java文件解析屬性
- 28. 用php解析腳本源文件
- 29. 使用java解析文本文件
- 30. Java文本文件解析錯誤
提取元數據是什麼意思?這與從文檔中提取文本主體相同嗎?除此之外,這看起來很好。 – Izza
+1。我用它。這似乎很適合做這項工作。稍有不足的是,因爲它使用了很多現有的庫,所以需要一堆罐子。 – Izza