2012-07-06 66 views
7

我使用jsoup的HTML,這是非常好的整理一些HTML,但我有一張無效的HTML如下:如何使用jsoup整理

<p>The recurrence, in close succession <ul><li>list item 1</li><li>list item 2</li></ul> second part of thisssss 

我要得到什麼是:

<p>The recurrence, in close succession </p><ul><li>list item 1</li><li>list item 2</li></ul> <p>second part of thisssss</p> 

那麼是jsoup能夠整理html並返回此輸出?

感謝

回答

9

是的,試試這個:

String html = "<p>The recurrence, in close succession <ul><li>list item 1</li><li>list item 2</li></ul> second part of thisssss"; 
String clean = Jsoup.clean(html, Whitelist.relaxed()); 

您可以使用另一種Whitelist爲好。

+1

請注意,JSoup確實清理了HTML。它解決了諸如「

    」之類的問題,並且可以設置爲解析'
    '。 – Andrew 2017-11-03 19:30:34