我有以下文字:如何知道Jsoup刪除哪些文本?
text<html/>text
而且爲了清理從HTML內容文本使用Jsoup庫。即如下面的代碼:
Document clean = new Cleaner(none()).clean(myDirtyDoc);
我要記錄錯誤的用戶,如:Malisious content was specified: "<html/>".
但我不知道如何正確地識別行Jsoup是乾淨的。
我試着使用StringUtils.difference(cleanedValue,值),但這種方法以另一種方式工作,即文檔說:
Compares two Strings, and returns the portion where they differ.
(More precisely, return the remainder of the second String,
starting from where it's different from the first.)
至於導致其返回的字符串是這樣的:<html/>text
。
將很好地瞭解任何可以在java中用於比較字符串的diff工具。