NotSupported：不支持的URL方案''：沒有處理程序可用於該方案

我想抓取這個網站，但得到'不支持：不支持的URL方案''：沒有處理程序可用於該方案'這個錯誤。如果規則沒有錯，爲什麼會出現這個問題，你的建議是什麼，請幫助我。非常感謝。NotSupported：不支持的URL方案''：沒有處理程序可用於該方案

代碼是在這裏：

from scrapy.spiders import CrawlSpider, Rule, BaseSpider 
from scrapy.linkextractors import LinkExtractor 
class FellowSearch(CrawlSpider): 
    name ='fellow' 
    allowed_domains = ['emma.cam.ac.uk'] 
    start_urls = [' https://www.emma.cam.ac.uk/'] 

    rules =(Rule(LinkExtractor(allow=(r'\?id=\d+$')),callback='parse_obj', follow=True),) 

    def parse_obj(self, response): 
     print response.url

來源

2017-04-03 Rana

我在'https'之前看到一個空格嗎？ –

您需要在您的start_urls變化HTTPS之前刪除空間start_urls = ['https://www.emma.cam.ac.uk/']。

來源

2017-04-03 20:49:07 vold

感謝您的幫助 – Rana

你能檢查我的scrapy規則嗎？它的scrapy只有31個url，但有超過100個 – Rana

你應該打開一個新的問題並指定你想要提取的URL，我很樂意幫助你。 – vold

NotSupported：不支持的URL方案''：沒有處理程序可用於該方案

回答

相關問題