2010-10-13 68 views
0

()的問題這是我在做什麼:StringEscapeUtils.unescapeHtml在轉義HTML實體爲Android

public static String htmlToText(String inString) 
{ 
String noentity=StringEscapeUtils.unescapeHtml(inString); 
return noentity; 
} 

這是我調用它:

String html = "<html><body>string 1<br />&#8212;<p>string 2</p></body></html>"; 
    String nohtml = Utility.htmlToText(html); 
    Log.i("NON HTML STRING:",nohtml); 

這是在日誌中輸出:

10-13 12:38:12.121: INFO/NON HTML STRING:(300): <html><body>string 1<br />â<p>string 2</p></body></html> 

根據參考文獻在http://www.w3.org/TR/html4/sgml/entities.html&#8212;應當更換d由「 - 」(這是我期望的輸出)而不是「â」(這不是我想要的)。

起初我使用JSoup,同樣的事情發生。認爲它是一個錯誤,我切換到org.apache.commons.lang,同樣的事情正在發生。

其他人都知道這裏發生了什麼?我錯過了明顯的東西嗎?

+0

http://www.docjar.com/html/api/org/apache/commons/lang/StringEscapeUtils.java。 HTML – 2012-05-02 14:32:09

回答

0

已解決.....

這是Logcat中輸出的問題。

把斷點告訴我實際的輸出是正確的。

這是第二次的logcat工具已拋出我送行當然....