我必須使用Java解碼包含以下實體的HTML字符串:「&#39」和「& apos」。 我使用的是Apache Commons Lang,但它不能解碼這兩個實體,所以,我現在正在做如下操作,但我正在尋找最快的方式來做我想做的事。Java中的HTML實體解碼:撇號
import org.apache.commons.lang.StringEscapeUtils;
public class StringUtil {
public static String decodeHTMLString(String s) {
return StringEscapeUtils.unescapeHtml((s.replace("'", "`").replace("'", "'")));
}
}
我搜索了老問題,但似乎沒有人回答我的問題。
呵呵,不要忘了在那裏加入「聰明的引號」。 – 2010-10-21 15:39:02
謝謝你指出。我想我會發現許多實體不包含在標準HTML中。但問題是一樣的。 – cdarwin 2010-10-21 15:47:49