2017-09-27 81 views
1

我剛剛學習如何使用scrapy,但運行我的第一個蜘蛛時遇到了問題。這是我的代碼,但它不提取任何數據!你能幫我:)無法使用此代碼使用scrapy提取任何數據

import scrapy 

    class Housin(scrapy.Spider): 
     name ='housin' 
     star_urls = ['http://www.metrocuadrado.com/apartamento/venta/bogota/usado/'] 

     def parse (self,response): 
      for href in response.css('a.data-details-id::attr(href)'): 
       yield response.follow(href, self.parse_livi) 

     def parse_livi(self,response): 
      yield { 
       'latitude': response.xpath('//input[@id="latitude"]/@value').extract_first(), 
       'longitud': response.xpath('//input[@id="longitude"]/@value').extract_first(), 
       'price': response.xpath('//dd[@class="important"]/text()').extract_first(), 
       'Barrio_com': response.xpath('.//dl/dt[h3/text()="Nombre común del barrio "]/following-sibling::dd[1]/h4/text()').extract_first(), 
       'Barrio_cat': response.xpath('.//dl/dt[h3/text()="Nombre del barrio catastral"]/following-sibling::dd[1]/h4/text()').extract_first(), 
       'Estrato': response.xpath('.//dl/dt[h3/text()="Estrato"]/following-sibling::dd[1]/h4/text()').extract_first(), 
       'id': response.xpath('//input[@id="propertyId"]/@value').extract_first() 
       } 
+0

你是否看了刮登錄以檢查它是否正在抓取並跟蹤URL,以及您的路徑聲明是否正確......缺少某人爲您進行調試 - 您可以輕鬆地自己本地化它 - 查看日誌,爲每個項目添加一些打印內容,重新嘗試提取等... :) –

回答

1

你的問題是,你的刮刀根本不啓動。下面

star_urls = ['http://www.metrocuadrado.com/apartamento/venta/bogota/usado/'] 

應該

start_urls = ['http://www.metrocuadrado.com/apartamento/venta/bogota/usado/'] 

那個錯誤(缺少t)導致scrapy至找不到任何開頭的URL,因此刮不啓動在所有

+0

非常感謝你!對不起,我是編程新手 –