2012-08-22 71 views
0

我正在處理XPath script.I想爲以下標記xpath。面臨的問題得到xpath

<td valign="top"> 
    " Oct 17, 2011 " 
    <br> 
    " 3 Pages - Pub ID: KLI6673261" 

我想XPath來獲取後<br> tag.Means我想只獲取文本[3頁 - 酒吧ID:KLI6673261]。請指引我。 謝謝。

+0

br元素不是封閉的,它應該是''
是有效的XML,我懷疑任何XPath解析器能夠解析這種數據。您應該先清理它或使用其他工具,如正則表達式。 – jolivier

+0

@jolivier我的XPath解析器可以很好地處理它。我認爲任何其他需要HTML的解析器(例如Firefox)也會這樣做 – BeniBela

回答

0

你可以得到以下的<td>一個<br>這樣所有文字:

/td/br/following-sibling::text() 

雖然如果你的XML/HTML沒有自動關閉<br>,它會認爲該文本是BR裏面,你會需要這個

/td/br/text()