2012-12-10 115 views
5

有沒有什麼辦法從bash中提取pdf的內容? (我有一個很大的學術論文文件夾,裏面有很多標籤,比如「1010.3423.pdf」,我想寫一個bash腳本來更合理的命名它,比如說用google搜索前幾行。)有沒有什麼辦法從bash中提取pdf的內容?

+0

[如何從PDF中提取格式化文本內容]的可能重複(http://stackoverflow.com/questions/2196621/how-to-extract-formatted-text-content-from-pdf) –

回答

3

pdftotext,它可以幫助您從pdf文件中獲得標題和作者。然後你可以使用它來谷歌,或自己生成一個文件名。

1

pdf2xml會爲您提供更詳細的信息,去年我一直在尋找這樣的實用程序,其中,我認爲pdf2xml是最好的。

相關問題