我一直在用這個軟件撞牆,已經研究過,而且幾乎已經嘗試了每個向我建議的庫。我目前正在嘗試用java編寫一個程序,它將從pdf文件中提取文本和圖像,並允許我將提取的內容寫入一個word文件。我設法使用ICEpdf庫提取內容,但問題是我需要能夠按照與讀取內容完全相同的順序編寫內容。因此,爲了澄清,我需要一個圖書館來幫助我跟蹤文本和圖像的位置,以便我可以將它們放在我的文檔中的相同位置。從PDF文件中提取文本和圖像
0
A
回答
0
+0
我會如何使用openOffice來做到這一點?它是否支持從PDF到MS Word的直接轉換?感謝您的幫助。 – iAmIronMan
0
看看這個:Advanced PDF parser for Java
OFF:
- 也據我所知,是八九不離十轉換PDF到HTML(這樣你可以跟蹤的一個python解析器在pdf中對象的排序)。我知道它不是Java,但你可能能夠使用輸出。 http://www.unixuser.org/~euske/python/pdfminer/index.html
相關問題
- 1. 從Asp.Net核心提取PDF文件中的圖像和文本
- 2. 從pdf文件中提取所有圖像和文本
- 3. 從pdf文件中提取文本
- 4. 從pdf文件中提取文本
- 5. 從PDF文件中提取文本
- 6. 從PDF文件中提取文本
- 7. 如何從pdf文件中提取文本和文本座標?
- 8. 分析pdf文件的格式並提取文本和圖像
- 9. 使用iText5從PDF中提取文本和圖像
- 10. 如何在Android上使用iText從PDF文件中提取圖像和文本
- 11. 從PDF中裁剪和提取文本
- 12. 從pdf文件中提取圖片
- 13. 從iOS的pdf文檔中讀取文本和圖像
- 14. 從PDF文檔中提取文本 - C#
- 15. 從pdf和word文件中提取文本
- 16. 從PDF中提取圖像
- 17. 從PDF中提取圖像
- 18. 使用Perl從PDF中提取圖像/文本
- 19. AS3 - 從圖像中提取文本
- 20. 從圖像中提取文本
- 21. 從圖像中提取文本
- 22. android:從圖像中提取文本
- 23. Vb.net從圖像中提取文本
- 24. 從圖像中提取文本。 OCR
- 25. 從Dropbox獲取PDF文件和圖像文件到Android手機?
- 26. 如何從PDF文件中提取圖像?
- 27. 從PDF文件提取圖層爲HTML
- 28. 從文本文件中提到的路徑中讀取圖像
- 29. 提取圖像和文字的座標和大小從PDF
- 30. 使用Python從word文檔中提取圖像和文本
這是註定不會正常工作的設計。有很多方法可以使圖像和文本出現在PDF中。你可能會使用它來處理由單一來源創建的PDF(對你來說是足夠的?),但從來沒有可靠的PDF。 – Durandal