我想下載一個網站的網址是建成使用wget卻忽略URL參數
http://www.example.com/level1/level2?option1=1&option2=2
內URL只有http://www.example.com/level1/level2是每個頁面獨特的內容,以及選項1的值和option2正在改變。事實上,由於這些變量,每個獨特的頁面可能有數百種不同的符號。我正在使用wget獲取所有網站的內容。由於這個問題我已經下載了超過3GB的數據。有沒有辦法告訴wget忽略網址問號背後的所有內容?我無法在手冊頁中找到它。
讓我們希望沒有參數的URL仍然會返回一些有用的信息。 – 2014-11-04 13:26:56
它的確如此。如果問號後面有或沒有任何內容,則沒有區別。似乎跟蹤瀏覽器來自哪裏等等。 – cootje 2014-11-04 13:29:42
基於wget手冊頁,此時不存在與使用wget的查詢字符串進行匹配。任何使用wget的具體原因不是像scrapy或curl與一些shell腳本一樣? – 2014-11-04 13:33:41