2016-05-17 58 views

回答

64

在推出的新版本(scrapy 1.1)中,2016-05-11爬網首先在爬網之前下載robots.txt。要更改您的settings.py這種行爲變化與ROBOTSTXT_OBEY

ROBOTSTXT_OBEY=False 

這裏是release notes

0

您需要確保的第一件事是您在請求中更改您的用戶代理,否則默認用戶代理將被阻止。