2010-09-01 19 views
0

我在xPath的幫助下解析網頁並檢索div元素的內容,它忽略了包含在該div元素中的HTML。如何讓它檢索包含HTML的div元素的全部內容?xPath不檢索HTML作爲內容的一部分

+0

請顯示驗證碼。 – shamittomar 2010-09-01 05:19:05

+0

請參閱我的回答,詳細解釋導致此類結果的原因。如果您提供特定的XML文檔(儘可能短)以及使用特定的XPath表達式,那麼這將是最好的 - 那麼人們就不必猜測。 – 2010-09-01 13:12:25

回答

0

使用

someExprSelectingtheDiv/node() 

這將選擇在表達的第一位置步驟中選擇的div S的所有子節點(標記和文本)。

請勿使用任何選定元素的string()值,因爲這只是該元素的連接(按文檔順序)文本後代。

此外,節點集的字符串值是此節點集的第一個節點(按文檔順序)的字符串值。

這些信息應該足以解釋在評估有問題的XPath表達式時觀察到的行爲。