XPath來在我使用scrapy一次

選擇從子節點和當前節點的文本，我一到這個地步，我想用下面的HTML結構提取一個列表的文本：XPath來在我使用scrapy一次

u'<div id="someId">' 
u'<p><strong>Text1:</strong> next to text 1</p>' 
u'<p><strong>Text2:</strong> next to text 2</p>' 
u'<p><strong>Text3:</strong> next to text </p>' 
u'</div>'

所以我想獲得只是文本：

文本1：旁邊的文本1

文本2：旁邊的文本2

文本3：NE xt to text3

我想用XPath儘可能提取文本，我一直試圖使用一些XPath謂詞而不解決我的問題。

與

response.xpath('//*[@id="someid"]/p/text()').extract()

我沒有才能計算P

任何幫助中的強大的標籤文本將超過讚賞更多。

來源

2016-12-10 jack.the.ripper

你很接近：

'//*[@id="someid"]/p//text()'

這將讓你一個list與p標籤內的所有文本。

來源

2016-12-10 20:36:33 eLRuLL

謝謝，我不知道「//」 –

我的榮幸@ jack.the.ripper – eLRuLL

XPath來在我使用scrapy一次

回答

相關問題