2014-10-27 79 views
1

我正在研究需要我從pdf中提取文本的問題。我正在使用pdfbox才能這樣做。所以,我在終端(linux的Ubuntu的)運行這個命令:爲文件夾中的所有文件遞歸運行終端命令

java -jar pdfbox-app-1.8.7.jar ExtractText [path leading to file here] 

和一切正常。但是,我想遞歸地爲特定目錄中的數千個文件執行此操作,因此我不必每次都手動插入pdf路徑。我將不勝感激任何來自終端或腳本的解決方案。

+0

兩個字:'人find')) – georg 2014-10-27 15:49:05

+0

'因爲我在的* .pdf;做java .... ExtractText $ i;完成',基本上 – 2014-10-27 15:49:58

回答

3

使用find命令:

find /path/to/directory -type f -exec java -jar pdfbox-app-1.8.7.jar ExtractText {} \; 
+0

對於其他一些用途,我需要最終給/ path/to /目錄,這有多可能? – supremum 2016-09-20 16:40:01

+1

在'\;'之前放置'/ path/to/directory'。 – Barmar 2016-09-20 16:46:08

+0

@supremum我建議你問一個新問題,而不是在評論中試圖解決這個問題。 – Barmar 2016-09-20 19:11:27

相關問題