-2
對不起,我的問題。 當我運行時,出現錯誤。我究竟做錯了什麼?請幫幫我。 我需要獲得紐約時報的所有文章。Scrapy。錯誤意外縮進。 Python
class OrphanSpider(CrawlSpider):
name = "atical"
allowed_domains = ["www.nytimes.com"]
start_urls = ["https://www.nytimes.com/section/world?WT.nav=page&action=click&contentCollection=World&module=HPMiniNav&pgtype=Homepage®ion=TopBar"]
rules = (
Rule(SgmlLinkExtractor(allow=(), restrict_xpaths=('//*[@id="story"]/div/',)), callback="parse_items", follow= True)
)
def parse_item(self, response):
hxs = HtmlXPathSelector(response)
l = OrphanLoader(parse_item(), hxs)
l.add_value('url', response.url)
l.add_xpath('name', "//*[@id="headline"]" % u"Название статьи:")
l.add_xpath('text', "//*[@id="story"]/div/" % u"Текст:")
錯誤:
IndentationError: unexpected indent
'parse'方法縮進不正確。這是你問題中的錯誤還是錯字? – kuro
@kuro它可能是錯誤的。怎麼了?我不明白。 – Maria