我想抓取這個網站,但得到'不支持:不支持的URL方案'':沒有處理程序可用於該方案'這個錯誤。如果規則沒有錯,爲什麼會出現這個問題,你的建議是什麼,請幫助我。非常感謝。NotSupported:不支持的URL方案'':沒有處理程序可用於該方案
代碼是在這裏:
from scrapy.spiders import CrawlSpider, Rule, BaseSpider
from scrapy.linkextractors import LinkExtractor
class FellowSearch(CrawlSpider):
name ='fellow'
allowed_domains = ['emma.cam.ac.uk']
start_urls = [' https://www.emma.cam.ac.uk/']
rules =(Rule(LinkExtractor(allow=(r'\?id=\d+$')),callback='parse_obj', follow=True),)
def parse_obj(self, response):
print response.url
我在'https'之前看到一個空格嗎? –