我想通過Scrapy刮一個網站。但是,該網站有時非常緩慢,並且在瀏覽器中首次請求時需要花費將近15-20秒的時間。無論如何,有時候,當我嘗試使用Scrapy抓取網站時,我不斷收到TCP超時錯誤。即使網站在我的瀏覽器上打開狀況良好。這裏的消息:Scrapy - 設置TCP連接超時
2017-09-05 17:34:41 [scrapy.downloadermiddlewares.retry] DEBUG: Gave up retrying <GET http://www.hosane.com/result/spec
ialList> (failed 16 times): TCP connection timed out: 10060: A connection attempt failed because the connected party di
d not properly respond after a period of time, or established connection failed because connected host has failed to re
spond..
我甚至覆蓋了USER_AGENT
設置進行測試。 我不認爲DOWNLOAD_TIMEOUT
設置在這種情況下工作,因爲它默認爲180秒,並且在給出TCP超時錯誤之前,Scrapy甚至不需要20-30秒。
任何想法是什麼導致這個問題?有沒有辦法在Scrapy中設置TCP超時?
非常感謝!這似乎是正確的答案。試用後我會盡快回復您! :) – Asym
請注意,對於我來說,即使超時時間很長,該網站並沒有每次都做出迴應,而且通常也沒有。 –
但是我能夠在我的瀏覽器中訪問該網站...那麼爲什麼它與Scrapy的行爲不同,即使是用戶代理... – Asym