2017-04-03 105 views
1

我想抓取這個網站,但得到'不支持:不支持的URL方案'':沒有處理程序可用於該方案'這個錯誤。如果規則沒有錯,爲什麼會出現這個問題,你的建議是什麼,請幫助我。非常感謝。NotSupported:不支持的URL方案'':沒有處理程序可用於該方案

代碼是在這裏:

from scrapy.spiders import CrawlSpider, Rule, BaseSpider 
from scrapy.linkextractors import LinkExtractor 
class FellowSearch(CrawlSpider): 
    name ='fellow' 
    allowed_domains = ['emma.cam.ac.uk'] 
    start_urls = [' https://www.emma.cam.ac.uk/'] 

    rules =(Rule(LinkExtractor(allow=(r'\?id=\d+$')),callback='parse_obj', follow=True),) 

    def parse_obj(self, response): 
     print response.url 
+0

我在'https'之前看到一個空格嗎? –

回答

1

您需要在您的start_urls變化HTTPS之前刪除空間start_urls = ['https://www.emma.cam.ac.uk/']

+0

感謝您的幫助 – Rana

+0

你能檢查我的scrapy規則嗎?它的scrapy只有31個url,但有超過100個 – Rana

+0

你應該打開一個新的問題並指定你想要提取的URL,我很樂意幫助你。 – vold

相關問題