2016-05-05 46 views
1

我一直在獲取HTML以及我希望在Xpath中運行的文本,因爲我只是想要文本而無法制定出如何阻止它。我一直在XPath輸出中獲取HTML!我如何獲得文本?

中的XPath

hxs.xpath('//h1[@class="body2"]').extract() 

的HTML

<div class="product-title cf"> 


      <h1 itemprop="name" class="body2"> 
       Cornish Ale Dozen - Case of 12 
      </h1> 


</div> 

任何建議,將不勝感激感謝

+0

什麼是'hxs'?這是什麼編程語言? – har07

+0

好吧,從您的問題歷史來看,這似乎是Python的Scrapy庫... – har07

回答

1

純XPath的指令來獲取文本節點,而不是父元素將是如下:

//h1[@class="body2"]/text() 

特別是,使用上述XPath應該按照您的預期工作,假定用於執行XPath的庫是Scrapy。

+0

謝謝,完美的回答!我認爲這會相對簡單。 –

相關問題