1
選擇從子節點和當前節點的文本,我一到這個地步,我想用下面的HTML結構提取一個列表的文本:XPath來在我使用scrapy一次
u'<div id="someId">'
u'<p><strong>Text1:</strong> next to text 1</p>'
u'<p><strong>Text2:</strong> next to text 2</p>'
u'<p><strong>Text3:</strong> next to text </p>'
u'</div>'
所以我想獲得只是文本:
文本1:旁邊的文本1
文本2:旁邊的文本2
文本3:NE xt to text3
我想用XPath儘可能提取文本,我一直試圖使用一些XPath謂詞而不解決我的問題。
與
response.xpath('//*[@id="someid"]/p/text()').extract()
我沒有才能計算P
任何幫助中的強大的標籤文本將超過讚賞更多。
謝謝,我不知道「//」 –
我的榮幸@ jack.the.ripper – eLRuLL