2016-12-10 54 views
1

選擇從子節點和當前節點的文本,我一到這個地步,我想用下面的HTML結構提取一個列表的文本:XPath來在我使用scrapy一次

u'<div id="someId">' 
u'<p><strong>Text1:</strong> next to text 1</p>' 
u'<p><strong>Text2:</strong> next to text 2</p>' 
u'<p><strong>Text3:</strong> next to text </p>' 
u'</div>' 

所以我想獲得只是文本:

文本1:旁邊的文本1

文本2:旁邊的文本2

文本3:NE xt to text3

我想用XPath儘可能提取文本,我一直試圖使用一些XPath謂詞而不解決我的問題。

response.xpath('//*[@id="someid"]/p/text()').extract() 

我沒有才能計算P

任何幫助中的強大的標籤文本將超過讚賞更多。

回答

3

你很接近:

'//*[@id="someid"]/p//text()' 

這將讓你一個listp標籤內的所有文本。

+0

謝謝,我不知道「//」 –

+0

我的榮幸@ jack.the.ripper – eLRuLL