2016-09-02 40 views
0

有了這個HTML的代碼段Xpath的簡化:提取自和子節點的文本

<td class="info">self-text 
<br> 
<b>child-text</b> 
</td> 

我想提取self-textchild-text。 到目前爲止,我用這正則表達式:

.//td[contains(@class, 'info')]/text() | .//td[contains(@class, 'info')]/b/text() 

有沒有什麼簡單的方法來做到這一點?

回答

1

您可以使用下面的XPath表達式將返回所有非空文本節點任何地方td元素中:

.//td[contains(@class, 'info')]//text()[normalize-space()]