2013-08-25 94 views
1

在接收響應我要下載並顯示驗證碼圖片,然後繼續爬行後,我的蜘蛛:如何在Scrapy中返回項目後繼續爬網?

def get_captcha(self, response): 
     print '\nLoading captcha...\n' 
     item = CaptchaItem() 
     hxs = HtmlXPathSelector(response) 
     captcha_img_src = hxs.select('//*[@id="captcha-image"]/@src').extract()[0] 
     item['image_urls'] = [captcha_img_src] 
     return item 

但加載圖像時,我不知道如何繼續以後爬行。

提示:驗證碼圖片無法無Cookie下載。

在此先感謝!

+0

你想要做什麼?這段代碼沒有給你帶來所有的驗證碼?請elaboratye? – Tushar

+0

我想顯示下載的驗證碼,然後用scrapy發送郵寄請求 – olysachok

回答

0

使用收益,而不是回報:

def get_captcha(self, response): 
    print '\nLoading captcha...\n' 
    item = CaptchaItem() 
    hxs = HtmlXPathSelector(response) 
    captcha_img_src = hxs.select('//*[@id="captcha-image"]/@src').extract()[0] 
    item['image_urls'] = [captcha_img_src] 
    yield item 
    #you may display here your scraped item and after that 
    #your further post request goes here... 
    yield your_request