2017-04-10 75 views
-2

對不起,我的問題。 當我運行時,出現錯誤。我究竟做錯了什麼?請幫幫我。 我需要獲得紐約時報的所有文章。Scrapy。錯誤意外縮進。 Python

class OrphanSpider(CrawlSpider): 
    name = "atical" 
    allowed_domains = ["www.nytimes.com"] 
    start_urls = ["https://www.nytimes.com/section/world?WT.nav=page&action=click&contentCollection=World&module=HPMiniNav&pgtype=Homepage&region=TopBar"] 

    rules = (
      Rule(SgmlLinkExtractor(allow=(), restrict_xpaths=('//*[@id="story"]/div/',)), callback="parse_items", follow= True) 
      ) 

      def parse_item(self, response): 
       hxs = HtmlXPathSelector(response) 
       l = OrphanLoader(parse_item(), hxs) 
     l.add_value('url', response.url) 
     l.add_xpath('name', "//*[@id="headline"]" % u"Название статьи:") 
     l.add_xpath('text', "//*[@id="story"]/div/" % u"Текст:") 

錯誤:

IndentationError: unexpected indent 
+1

'parse'方法縮進不正確。這是你問題中的錯誤還是錯字? – kuro

+0

@kuro它可能是錯誤的。怎麼了?我不明白。 – Maria

回答

-2

你混合製表符和空格中的每一行的開頭。使它們保持一致,無論是所有標籤還是所有空格。或者它可能是這樣的行:def parse_item(self,response):沒有正確縮進