2013-10-03 48 views
7

我正在使用scrapy CrawlSpider並定義了一個雙絞線來控制我的爬行程序。在測試期間,我爬過一個收集超過幾GB數據的新聞網站。大多數情況下,我對最新的故事感興趣,所以我正在尋找一種方法來限制請求的頁數,字節或秒。Scrapy:限制請求或請求字節數

是否有明確的

  • request_bytes
  • request_counts
  • 運行時間(秒)極限的常用方法?

回答