0
()的問題這是我在做什麼:StringEscapeUtils.unescapeHtml在轉義HTML實體爲Android
public static String htmlToText(String inString)
{
String noentity=StringEscapeUtils.unescapeHtml(inString);
return noentity;
}
這是我調用它:
String html = "<html><body>string 1<br />—<p>string 2</p></body></html>";
String nohtml = Utility.htmlToText(html);
Log.i("NON HTML STRING:",nohtml);
這是在日誌中輸出:
10-13 12:38:12.121: INFO/NON HTML STRING:(300): <html><body>string 1<br />â<p>string 2</p></body></html>
根據參考文獻在http://www.w3.org/TR/html4/sgml/entities.html—
應當更換d由「 - 」(這是我期望的輸出)而不是「â」(這不是我想要的)。
起初我使用JSoup,同樣的事情發生。認爲它是一個錯誤,我切換到org.apache.commons.lang,同樣的事情正在發生。
其他人都知道這裏發生了什麼?我錯過了明顯的東西嗎?
http://www.docjar.com/html/api/org/apache/commons/lang/StringEscapeUtils.java。 HTML – 2012-05-02 14:32:09