這些是在Ipython中運行的代碼。Scrapy的HtmlResponse不會從URL中檢索數據
from scrapy.selector import Selector
from scrapy.http import HtmlResponse
response = HtmlResponse(url='https://en.wikipedia.org/wiki/Pan_American_Games')
datas = Selector(response=response).xpath('//div[@class="thumb tleft"]')
當我執行response
我<200 https://en.wikipedia.org/wiki/Pan_American_Games>
但是,當我執行reponse.body
我''
(NULL)
好像HtmlResponse
沒有檢索到任何HTML的這個頁面信息。
有沒有人知道如何解決這個問題?
僅供參考,如果我在命令提示符下運行$ scrapy shell https://en.wikipedia.org/wiki/Pan_American_Games
,則響應不會爲NULL。 我不想做scrapy shell url
的方式,因爲我將通過URL列表循環運行。
謝謝