當我解析此代碼Jsoup:Jsoup解析錯誤(標籤p範圍內的標籤表)
<p>
<table>[...]</table>
</p>
Jsoup返回:
<p></p>
<table>[...]</table>
這是一個錯誤?我怎樣才能解決這個問題?
當我解析此代碼Jsoup:Jsoup解析錯誤(標籤p範圍內的標籤表)
<p>
<table>[...]</table>
</p>
Jsoup返回:
<p></p>
<table>[...]</table>
這是一個錯誤?我怎樣才能解決這個問題?
我認爲它與你的例子不是「有效」的HTML有關。我相信一個表不能存在於p標籤中。 Jsoup可能會執行正確的HTML。
jsoup非常聰明。如果您使用其默認解析方法,它會將您的輸入文本重新組合爲有效的html內容。
Document doc = Jsoup.parse(html);
其實,jsoup可以處理象XML文本(當然,包括HTML和XML)。您可以嘗試使用follwing方法來解析類xml文本。它不會改變您的輸入,並按原樣解析輸入。
Document doc = Jsoup.parse(html, "", Parser.xmlParser());
這並不回答OP的問題,即Jsoup的回報是否是錯誤的。 – verdammelt 2014-03-11 14:05:53
@ verdammelt,是的,它可能會從Jsoup返回無效的html代碼。但提問者可能想找到一種方法來避免智能jsoup的檢查和重組過程。 – 2014-03-11 14:33:39
如果我默認標籤代替p標籤,然後用jsoup解析代碼....效果很好。 – miaccio 2012-04-04 08:46:38