2013-06-18 54 views
0

我有一些pdf文件在一個文件夾中,通過使用以下命令我能夠獲取包含匹配單詞的文件名和行。如何在Linux中使用pdftext搜索多個pdf文件中的單詞

pdftotext "sample.pdf" - | grep "search-word" 

但這是一個單一的PDF文件,唯一的工作,我想它包含在他們的content.i搜索詞不希望顯示匹配行的文件夾中的所有文件名,請建議我。 感謝

回答

1

下應列出匹配模式的文件:

for i in `find . -type f -name "*.pdf"`; do 
    pdftotext "${i}" - | grep -lq "search-word" && echo $i; 
done 

-q選項的grep防止任何輸出到標準輸出。 -l列出了匹配的文件。

+0

謝謝你的回覆,在你已經提到sample.pdf的代碼中,但我不想在代碼中提到單個pdf文件名。 – user2353439

+0

@ user2353439這是一個錯字(實際上是複製/粘貼錯誤)。固定。 – devnull

+0

感謝它的工作,我可以做內容搜索其他文件格式,如.html,.epub,.doc請給我建議。 – user2353439

相關問題