0
我正在嘗試使用請求對象抓取scrapy網站。我通過需要身份驗證的代理連接到互聯網,並且此身份驗證阻止我抓取網站: DEBUG: Crawled (400) <GET http://auth4/robots.txt> (referer: None)
scrapy請求中的代理身份驗證
如何在代理中進行身份驗證或跳過它以訪問網站?
謝謝!
我正在嘗試使用請求對象抓取scrapy網站。我通過需要身份驗證的代理連接到互聯網,並且此身份驗證阻止我抓取網站: DEBUG: Crawled (400) <GET http://auth4/robots.txt> (referer: None)
scrapy請求中的代理身份驗證
如何在代理中進行身份驗證或跳過它以訪問網站?
謝謝!
我想你需要設置用戶代理。嘗試對用戶代理的settings.py
編輯設置爲'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.10; rv:39.0) Gecko/20100101 Firefox/39.0'
:看看這個How to use scrapy with an internet connection through a proxy with authentication