我想從此http://www.npr.org/rss/#feeds新聞饋送網站獲取鏈接和類別。Scrapy Shell XPath
這是我在scrapy殼的XPath:
a = sel.xpath('//ul[@class="rsslinks"]/li/a/@href').extract()
b = sel.xpath('//ul[@class="rsslinks"]/li/a/text()').extract()
但是B的長度是一個比的長度較少。我不知道我在這裏錯過了什麼。但是這會導致數據出現問題。
從下面的圖片,類別名稱爲「最多人分享的故事」,但鏈接是「新聞頭條」
任何幫助,將不勝感激
謝謝!這是非常有用的信息! – m0rpheu5
在我看來,你的答案的措詞是誤導性的,因爲它表明,在一個名爲「text」的元素節點的意義上有一個'text'元素,就像'strong'一樣。請清楚地說明文本節點不是元素節點。 –
@MathiasMüller非常好的一點,謝謝,我認爲現在應該會更好。而且,順便說一句,謝謝你貢獻'xpath'標籤 - 從你的答案中學到很多東西。 – alecxe