2017-04-19 37 views
-1

簡短版本:請給我一個建議,以發佈一個問題,幫助我使用JAVA編程將PDF轉換爲TEXT。關於PDF主題位置的建議

詳情: 我一直在努力嘗試使用JAVA將PDF更改爲文本文件,並儘量保持格式儘可能接近PDF。我目前一直在使用一個單獨的,免費的第三方程序來完成轉換,然後我製作的JAVA程序完成了我想要的所有功能。我問了很多地方,大多數推薦的PDFBox沒有用。所有PDFBox所做的都與Adobe Read X所做的一樣,這會造成大量文本混亂。我嘗試了很多東西,花了很多時間。我現在要做的就是共享一個我正在嘗試轉換的PDF文件,希望有人可以用一些可以幫助轉換的JAVA代碼來幫助我。我只是真的有權分享這個舊文件一次(即使你我99%肯定可以在其他地方分享這個文件也沒問題),我想在最有效的地方發佈這個問題。

+1

你的問題似乎只是尋求建議:1)一個Q&A網站和2)替代PDFBox的。建議請求是無關緊要的。 –

+0

爲什麼不簡單地建立一個單一的可執行文件或腳本,通過以正確的順序調用它們來使用現有的程序? –

+0

嗨Stefan Hegny - 我從來沒有嘗試過。我會把它作爲一個選項來看看,看看我能否弄清楚如何做到這一點。謝謝! –

回答

0

那麼短版(和真正回答我的問題,實際) 答案是:http://stackoverflow.com

特別感謝@TilmanHausherr誰超出去按照我的更新和幫助我更多。

       Longer version. 

我仍然有一些格式問題,但我想我可以自己找其餘的。就我所要求的使用Java正確格式化文檔而言,已經完成了。至於這個問題被問到這個文檔的格式是否正確,它看起來不像我用過的其他東西那麼漂亮。

之後,我被卡住了,因爲會話後格式化不正確。我之前已經問過,大多數人都說這太難解釋了。最後,我必須重新學習如何附加PDFBox,解決其他人遇到的常見問題,以及TilmanHausherr的一行代碼,如評論中所示。

當我開始這個項目時,我不得不學習如何讓PDFBox與我的IDE一起工作以及如何安排庫。等等。然後,我繼續找到一些使用PDFBox從PDF轉換文本的舊搜索代碼。我無法分享用於轉換的代碼,但需要大約4到5分鐘才能搜索原始海報。爲了使其工作起來,我還需要對其代碼進行一些修改,但我只是遵循IDE中的提示:Eclipse。

我用這個代碼寫入文本文件,而不是一個格式:

String textFromMain = textForAll; 
try( PrintWriter out = new PrintWriter("text.txt") ) { 
    out.println(textFromMain); 
}