0
我有一些pdf文件在一個文件夾中,通過使用以下命令我能夠獲取包含匹配單詞的文件名和行。如何在Linux中使用pdftext搜索多個pdf文件中的單詞
pdftotext "sample.pdf" - | grep "search-word"
但這是一個單一的PDF文件,唯一的工作,我想它包含在他們的content.i搜索詞不希望顯示匹配行的文件夾中的所有文件名,請建議我。 感謝
我有一些pdf文件在一個文件夾中,通過使用以下命令我能夠獲取包含匹配單詞的文件名和行。如何在Linux中使用pdftext搜索多個pdf文件中的單詞
pdftotext "sample.pdf" - | grep "search-word"
但這是一個單一的PDF文件,唯一的工作,我想它包含在他們的content.i搜索詞不希望顯示匹配行的文件夾中的所有文件名,請建議我。 感謝
下應列出匹配模式的文件:
for i in `find . -type f -name "*.pdf"`; do
pdftotext "${i}" - | grep -lq "search-word" && echo $i;
done
的-q
選項的grep防止任何輸出到標準輸出。 -l
列出了匹配的文件。
謝謝你的回覆,在你已經提到sample.pdf的代碼中,但我不想在代碼中提到單個pdf文件名。 – user2353439
@ user2353439這是一個錯字(實際上是複製/粘貼錯誤)。固定。 – devnull
感謝它的工作,我可以做內容搜索其他文件格式,如.html,.epub,.doc請給我建議。 – user2353439