2014-01-15 113 views
0

我一直在用這個軟件撞牆,已經研究過,而且幾乎已經嘗試了每個向我建議的庫。我目前正在嘗試用java編寫一個程序,它將從pdf文件中提取文本和圖像,並允許我將提取的內容寫入一個word文件。我設法使用ICEpdf庫提取內容,但問題是我需要能夠按照與讀取內容完全相同的順序編寫內容。因此,爲了澄清,我需要一個圖書館來幫助我跟蹤文本和圖像的位置,以便我可以將它們放在我的文檔中的相同位置。從PDF文件中提取文本和圖像

+0

這是註定不會正常工作的設計。有很多方法可以使圖像和文本出現在PDF中。你可能會使用它來處理由單一來源創建的PDF(對你來說是足夠的?),但從來沒有可靠的PDF。 – Durandal

回答

0

PDF to Word轉換器是一個非常複雜的命題。

你最好打賭可能會使用Open Office爲你做,甚至不嘗試處理中間步驟。

http://www.openoffice.org/api/

+0

我會如何使用openOffice來做到這一點?它是否支持從PDF到MS Word的直接轉換?感謝您的幫助。 – iAmIronMan