2014-01-24 25 views
2

我對JSoup非常陌生。而且,我使用下面的代碼清理HTML:使用JSoup清理html時維護樣式

String clean = Jsoup.clean(html, Whitelist.relaxed()); 

我得到了所需的HTML,但所有的造型,如粗體,斜體等丟失。

我如何維護與各自使用JSoup樣式的HTML代碼? 如果有其他圖書館這樣做,請推薦我一個嗎?

+0

你可以添加你想要清理的示例html嗎? – PopoFibo

回答

1

當您使用Jsoup.clean(html, Whitelist.relaxed())

Whitelist.relaxed()

直接從文檔,

這個白名單可以實現各種文本和結構體HTML的:一, b,blockquote,br,caption,cite,code,col,colgroup,dd,dl,dt,em,h1,h2,h3,h4,h5,h6,i,img,li,ol,p,小,罷工,強,子,sup,表,tbody,td,tfoot,th,thead,tr,u,ul

如果你想讓更多的元素(即樣式屬性)將它們添加到Whitelist實例以允許通過它。您可以使用從白名單API

addTags(java.lang.String...) 
addAttributes(java.lang.String, java.lang.String...) 

以下方法請閱讀Whitelist從JSOUP庫中的文檔。

+1

啊,我看到了。感謝您的建議。我會盡力解決您的建議:D –

+0

歡迎您:)祝福您! – Keerthivasan