用JSOUP(非正則表達式)刪除只有html標籤(保留所有定製/未知標籤)的正確方法是什麼?Jsoup只刪除html標籤
預期輸入:
<html>
<customTag>
<div> dsgfdgdgf </div>
</customTag>
<123456789/>
<123>
<html123/>
</html>
預期輸出:
<customTag>
dsgfdgdgf
</customTag>
<123456789/>
<123>
<html123/>
我試圖用WhiteList.none()清潔使用,但它還會刪除自定義標記。
我也試過:
String str = Jsoup.parse(html).text()
但它還會刪除自定義標記。
這個answer對我不好,因爲自定義標籤的數量是無限的。
沒有完整的配方,但你可能要檢查消毒 – Marged