2012-05-24 84 views
2

使用Jsoup我試圖找到錯誤的HTML結構,如:Jsoup不能選擇p元素的父元素

<body><p><h1>some text</h1></p></body> 

我首先選擇的標題標籤,然後使用headingElement.parent()得到這個h1標籤的父。但代替p作爲其父母,我得到body。 有誰知道爲什麼?

回答

0

JSoup,當它解析HTML,有一個像任何好的HTML解析器,已經應用,指出了<h1>標籤自動關閉所有打開的<p>元素的規則,所以<p><h1>已經同級的<body>元素的子在DOM中。

+0

你能爲此提供一個資源嗎? –

+0

當我試着它作爲一個原始代碼,並給出了相同的結果... –

+0

以及你有什麼建議如何解決我的問題?我的意思是找到正確和錯誤的標籤組合? – Hossein