0
這可能是一個重複的問題。我正在嘗試運行Scrapy蜘蛛,但無法運行。爲什麼我會收到錯誤消息「HtmlResponse沒有屬性urljoin」?如果request_count是3並且response_count也是3,那麼Scrapy統計數據暗示了什麼?我的代碼在這裏。我希望在這個問題上有任何幫助。爲什麼Scrapy不能抓取/解析?
import scrapy
from scrapy.http.request import Request
from scrapy.spiders import BaseSpider
from scrapy.selector import HtmlXPathSelector
class BotSpider_2(BaseSpider):
name = 'BotSpider_2'
name = "google.co.th"
start_urls = ["http://www.google.co.th/"]
def parse(self, response):
sel = Selector(response)
sites = sel.xpath('//title/text()').extract()
print sites