我知道一個恆定的延遲可以是否可以在scrapy中設置動態下載延遲?
settings.py
DOWNLOAD_DELAY = 2
設置但是,如果我延遲設置爲2秒它是沒有效率不夠。如果我將DOWNLOAD_DELAY設置爲0.
爬蟲能夠抓取大約10個頁面。在那之後,目標頁面會返回類似「你太頻繁請求」的內容。
我想要做的是保持download_delay爲0.一旦在HTML中發現「請求太頻繁」的味精。它將延遲更改爲2秒。一段時間後,它切換回零。
有沒有任何模塊可以做到這一點?或者其他更好的想法來處理這種情況?
更新: 我發現這是一個擴展調用AutoThrottle 但它是否能夠自定義這樣的邏輯?
if (requesting too frequently) is found
increase the DOWNLOAD_DELAY
正是Autothrottle所做的;你也可以設置其限制。 – nramirezuy 2014-12-03 18:01:42