2015-10-13 19 views
3
$ wget www.amazon.com 
Resolving www.amazon.com... 205.251.242.54 
Connecting to www.amazon.com|205.251.242.54|:80... connected. 
HTTP request sent, awaiting response... 503 Service Unavailable 
2015-10-12 23:27:24 ERROR 503: Service Unavailable. 

我試圖在URL上發出wget並收到此錯誤。我需要存儲的HTML文件和我希望的wget將工作:(Wget 503不可用的錯誤

我使用--no-proxy選項嘗試,但它並不能幫助。

回答

3

我可以發出wget http://www.amazon.com沒有任何問題。
我的猜測是你得到了阻止亞馬遜再殺一點點地多後...

503服務不可用

服務器是CURREN由於 臨時超載或維護服務器,無法處理該請求。其含義是 ,這是一個暫時的情況,延遲一段時間後將會緩解。如果已知,延遲的長度可以在 Retry-After標題中指示。如果沒有給出Retry-After,那麼客戶端應該處理響應,就像處理500響應一樣。

Note: The existence of the 503 status code does not imply that a 
    server must use it when becoming overloaded. Some servers may wish 
    to simply refuse the connection. 

http://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html

+0

有沒有更好的辦法做到比wget? – yguw

+0

您可以嘗試使用'curl','php curl','python urllib2','java jsoup'等,並且根據您的請求設置'user agent',旋轉代理也可以幫助您。 –

+0

要嘗試的另一件事可能是在wget命令之間添加睡眠語句。他們可能不喜歡你每秒(或每分鐘或每小時)提出如此多的請求,但是增加'sleep 1s'會大大減少每秒和每分鐘的請求次數。 –

3

的問題是,亞馬遜防火牆阻止其用戶代理沒有被設置,或不正確的連接。

你可以嘗試設置用戶代理wget和用下面的命令(注意,您可能需要改變一個有效的用戶代理,如果這一個無效)獲得亞馬遜:

wget -U "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.79 Safari/537.36" https://amazon.com