我正在研究需要我從pdf中提取文本的問題。我正在使用pdfbox才能這樣做。所以,我在終端(linux的Ubuntu的)運行這個命令:爲文件夾中的所有文件遞歸運行終端命令
java -jar pdfbox-app-1.8.7.jar ExtractText [path leading to file here]
和一切正常。但是,我想遞歸地爲特定目錄中的數千個文件執行此操作,因此我不必每次都手動插入pdf路徑。我將不勝感激任何來自終端或腳本的解決方案。
我正在研究需要我從pdf中提取文本的問題。我正在使用pdfbox才能這樣做。所以,我在終端(linux的Ubuntu的)運行這個命令:爲文件夾中的所有文件遞歸運行終端命令
java -jar pdfbox-app-1.8.7.jar ExtractText [path leading to file here]
和一切正常。但是,我想遞歸地爲特定目錄中的數千個文件執行此操作,因此我不必每次都手動插入pdf路徑。我將不勝感激任何來自終端或腳本的解決方案。
兩個字:'人find')) – georg 2014-10-27 15:49:05
'因爲我在的* .pdf;做java .... ExtractText $ i;完成',基本上 – 2014-10-27 15:49:58