2011-07-20 117 views
1

嘿傢伙coudln't避開這個。我有結構如下的HTML:Xpath獲取沒有節點子內容的節點

<div class="review-text"> 
<div id="reviewerprofile"> 
<div id="revimg"></div> 
<div id="reviewr">marc</div> 
<div id="revdate">2011-07-06</div> 
</div> 
this is an awesome review 

</div> 

什麼,我試圖讓僅僅是文本「這是一個真棒檢討」,但everytyme我查詢節點i也得到孩子的其他內容。現在就用這樣的東西「.div[@class='review-text']」如何只獲取文本?坦克你非常多

回答

1

你快到了!只需在XPath末尾添加/ text()即可獲取文本節點。

0

諸如// div的XPath表達式返回一組節點,在本例中爲div元素。這些實際上是指向原始樹中原始節點的指針;節點仍然連接到他們的父母,孩子,祖先和兄弟姐妹。如果您看到div元素的子元素並且不想要它們,那不是XPath處理器的錯誤,這是任何處理由XPath表達式返回的結果的軟件的錯誤。

按照建議,您可以通過使用/ text()來獲得div元素的直接子元素。但是,假設您確切知道您期望在HTML頁面中找到什麼 - 如果「真棒」以斜體顯示,它會給您不同的東西。

相關問題