2012-04-03 80 views

回答

0

我認爲它與你的例子不是「有效」的HTML有關。我相信一個表不能存在於p標籤中。 Jsoup可能會執行正確的HTML。

+0

如果我默認標籤代替p標籤,然後用jsoup解析代碼....效果很好。 – miaccio 2012-04-04 08:46:38

0

jsoup非常聰明。如果您使用其默認解析方法,它會將您的輸入文本重新組合爲有效的html內容。

Document doc = Jsoup.parse(html);

其實,jsoup可以處理象XML文本(當然,包括HTML和XML)。您可以嘗試使用follwing方法來解析類xml文本。它不會改變您的輸入,並按原樣解析輸入。

Document doc = Jsoup.parse(html, "", Parser.xmlParser());

+0

這並不回答OP的問題,即Jsoup的回報是否是錯誤的。 – verdammelt 2014-03-11 14:05:53

+0

@ verdammelt,是的,它可能會從Jsoup返回無效的html代碼。但提問者可能想找到一種方法來避免智能jsoup的檢查和重組過程。 – 2014-03-11 14:33:39