有沒有什麼辦法從bash中提取pdf的內容? (我有一個很大的學術論文文件夾,裏面有很多標籤,比如「1010.3423.pdf」,我想寫一個bash腳本來更合理的命名它,比如說用google搜索前幾行。)有沒有什麼辦法從bash中提取pdf的內容?
5
A
回答
3
有pdftotext,它可以幫助您從pdf文件中獲得標題和作者。然後你可以使用它來谷歌,或自己生成一個文件名。
3
嘗試pdftotext來提取文本? http://en.wikipedia.org/wiki/Pdftotext
1
pdf2xml會爲您提供更詳細的信息,去年我一直在尋找這樣的實用程序,其中,我認爲pdf2xml是最好的。
相關問題
- 1. 從PDF中提取所有內容
- 2. 有沒有什麼辦法解析網站內容的DOM樹?
- 3. 有沒有辦法從iframe的內容獲取父網址?
- 4. 有沒有什麼辦法從tinymce中提取圖像的src屬性?
- 5. 有沒有什麼辦法可以在windows phone中創建pdf
- 6. 有沒有什麼辦法從本地內容的actionscript執行js函數?
- 7. 有沒有辦法從solr中提取所有的令牌?
- 8. 有沒有什麼辦法用C#讀取PDF中表格的特定列
- 9. 有沒有什麼辦法可以用php獲取html內容/值?
- 10. 有沒有什麼辦法從tendermint的blockchain獲取數據API
- 11. 有什麼辦法可以從瀏覽器內部保存PDF?
- 12. 有沒有辦法從Web UI中提取bitbucket中的更改?
- 13. 有沒有辦法從NetBeans中的單個類中提取JavaDoc?
- 14. 有沒有什麼辦法可以從doc文件獲得內容php
- 15. 有沒有辦法在控制器中獲取PartialView HTML內容?
- 16. 有沒有辦法將內聯CSS提取到CSS文件中
- 17. 有沒有什麼辦法從C++庫獲取ICLRMetaHost
- 18. 有什麼辦法從IEnumerable中提取X元素?
- 19. 有什麼辦法從SQLite中提取查詢嗎?
- 20. django:有沒有辦法直接從內存中提供文件
- 21. Ant macrodef:有沒有辦法獲取元素參數的內容?
- 22. 有沒有什麼辦法可以使用PDO獲取上次提取的ID
- 23. 有沒有辦法從html內容中提取有效的腳本並使用jQuery執行它?
- 24. 有沒有辦法從視圖中提取畫布或位圖?
- 25. 有沒有辦法從NSS中提取密鑰
- 26. 有沒有辦法從Firefox cookies文件中提取cookie?
- 27. 有沒有辦法從照片中提取QR碼或條碼
- 28. 有沒有辦法從WebException中提取消息?
- 29. 有沒有辦法從Crystal Reports中提取查詢?
- 30. 有沒有辦法讓Oracle Data Integrator從MongoDB中提取數據
[如何從PDF中提取格式化文本內容]的可能重複(http://stackoverflow.com/questions/2196621/how-to-extract-formatted-text-content-from-pdf) –