開源實現將是首選。有沒有任何Java庫將文檔從PDF轉換爲HTML?
6
A
回答
2
顯然,這不是一件容易的事,PDF格式比HTML的一個更豐富(加上你必須提取圖像和鏈接它們,等)。
簡單的文本提取更簡單(儘管不是微不足道的...)。
我看到你的問題類似的問題的側邊欄:Converting PDF to HTML with Python指向庫(poppler的,這顯然是用C++編寫,或許可以用JNI/JNA訪問)和一個相關的問題能夠提供更多的答案。
1
1
嘗試使用來自apache基金會的PDFBox。
相關問題
- 1. 是否有任何Java庫將文檔從HTML轉換爲PDF?
- 2. 如何將HTML轉換爲PDF文檔
- 3. 將大型HTML文檔轉換爲PDF
- 4. 將文檔轉換爲html和pdf
- 5. 如何使用Java將HTML頁面轉換爲PDF文檔?
- 6. 將文檔轉換爲pdf
- 7. cfdocument沒有正確地將Word文檔轉換爲PDF
- 8. 有沒有什麼辦法可以使用Java中的LibreOffice SDK將任何MS文檔轉換爲PDF?
- 9. 將PDF轉換爲HTML文件Java API
- 10. 有沒有任何工具或技術將phtoshop轉換爲HTML?
- 11. 有沒有辦法使用PHP將PDF轉換爲HTML/CSS?
- 12. 如何將文檔轉換爲PDF
- 13. 有沒有任何純java的方式將.wav轉換爲.mp3?
- 14. 通過編程將PDF文檔轉換爲Word文檔沒有任何第三方工具(SSRS 2005)
- 15. 如何將pdf文檔轉換爲html文件?
- 16. 將HTML轉換爲Google文檔轉換
- 17. 將HTML轉換爲PDF - 用於ASP.net的任何庫
- 18. 將pdf文件轉換爲word文檔
- 19. 如何將html鏈接在線文檔轉換爲pdf?
- 20. 我如何將我的html視圖轉換爲pdf文檔
- 21. 將彩色文本從HTML轉換爲DOCBOOK(並轉換爲PDF)
- 22. 將HTML文檔轉換爲PCL的Java庫
- 23. 使用PDF導出將任何文檔轉換爲灰度PDF文件?
- 24. 將PDF轉換爲PHP中的HTML庫
- 25. 如何將html轉換爲pdf與PDF?
- 26. XPages:如何將ODT轉換爲Java中的PDF文檔
- 27. 如何將Markdown文檔轉換爲HTML?
- 28. 將html文件轉換爲PDF使用Cocoa-Touch的iOS文檔
- 29. C#。文檔轉換爲PDF
- 30. 將PDF轉換爲Google文檔
我想知道一個解決方案了。 PDFBox的是能夠做到這一點(http://java.dzone.com/articles/converting-pdf-html-using?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+javalobby%2Ffrontpage+%28Javalobby+%2F+Java+Zone%29 ),但方式非常有限。 – Alp 2011-05-02 11:15:21