2014-09-25 33 views
0

我在Window機器上使用wget。我只想要pdf文件。如果應用程序/類型是pdf。只允許允許Wget只下載應用程序類型的PDF

我使用這個命令

wget --accept pdf www.google.com 

它下載谷歌的索引頁進行下載。

長度:19404(19K)的text/html]保存到: `[email protected]_rd=cr & EI = 5O8jVLycNuvA8gftoYGIBg」

我不想允許。如果只有pdf。

任何想法

感謝

回答

1

正常情況下應該

的wget --header = '接受:應用/ PDF' www.google.com

但谷歌.com似乎忽略了Accept:標頭,因此您可能需要

wget --debug --header ='接受:application/pdf'www.google.com 2> & 1 | grep'Content-Type:application/pdf'

並測試該命令的結果。

+0

它是stil下載html文件 – Hitu 2014-09-25 11:10:31

+0

正如我所說的Google忽略標題。您的工作是檢查上述命令的狀態,如果狀態不成功,則忽略該文件。沒有其他辦法。 對於正確處理Accept頭的服務器,它們不會發送除PDF之外的任何內容(如果存在PDF資源)。 – dee 2014-09-25 11:18:57

相關問題