2016-06-22 29 views
3

我正在寫一個scrapy蜘蛛,我需要用splash來渲染一些響應。我的蜘蛛是基於CrawlSpider的。我需要呈現我的start_url響應來提供抓取蜘蛛。不幸的是,我的爬行蜘蛛在呈現第一響應後停止。任何想法出了什麼問題?CrawlSpider with Splash在第一個URL後卡住

class VideoSpider(CrawlSpider): 

    start_urls = ['https://juke.com/de/de/search?q=1+Mord+f%C3%BCr+2'] 

rules = (
    Rule(LinkExtractor(allow=()), callback='parse_items',process_request = "use_splash",), 
) 

def use_splash(self, request): 
    request.meta['splash'] = { 
      'endpoint':'render.html', 
      'args':{ 
       'wait':0.5, 
       } 
      }  
    return request 

def start_requests(self): 
    for url in self.start_urls: 
     yield scrapy.Request(url, self.parse, meta={ 
      'splash': { 
       'endpoint': 'render.html', 
       'args': {'wait': 0.5} 
     } 
    }) 


def parse_items(self, response):  
    data = response.body 
    print(data) 

回答

相關問題