問題是,「\ uXXXX」符號用於4個十六進制數字,形成16位char
。
你有Unicode代碼點以上的16位範圍,U + F1EB和U + 1F1F7。這將用兩個字符表示,即所謂的代理對。
您可以使用代碼點創建一個字符串:
int[] codepoints = {0x1F1EB, 0x1F1F7};
String s = new String(codepoints, 0, codepoints.length);
或者使用代理對,可導這樣的:
System.out.print("\"");
for (char ch : s.toCharArray()) {
System.out.printf("\\u%04X", (int)ch);
}
System.out.println("\"");
給予
"\uD83C\uDDEB\uD83C\uDDF7"
迴應評論:如何解碼
「\ uD83C \ uDDEB」 是表示U + 1F1EB和 「\ uD83C \ uDDF7」 兩個替代16個的字符是代理對爲U + 1F1F7。
private static final int CP_REGIONAL_INDICATOR = 0x1F1E7; // A-Z flag codes.
/**
* Get the flag codes of two (or one) regional indicator symbols.
* @param s string starting with 1 or 2 regional indicator symbols.
* @return one or two ASCII letters for the flag, or null.
*/
public static String regionalIndicator(String s) {
int cp0 = regionalIndicatorCodePoint(s);
if (cp0 == -1) {
return null;
}
StringBuilder sb = new StringBuilder();
sb.append((char)(cp0 - CP_REGIONAL_INDICATOR + 'A'));
int n0 = Character.charCount(cp0);
int cp1 = regionalIndicatorCodePoint(s.substring(n0));
if (cp1 != -1) {
sb.append((char)(cp1 - CP_REGIONAL_INDICATOR + 'A'));
}
return sb.toString();
}
private static int regionalIndicatorCodePoint(String s) {
if (s.isEmpty()) {
return -1;
}
int cp0 = s.codePointAt(0);
return CP_REGIONAL_INDICATOR > cp0 || cp0 >= CP_REGIONAL_INDICATOR + 26 ? -1 : cp0;
}
System.out.println("Flag: " + regionalIndicator("\uD83C\uDDEB\uD83C\uDDF7"));
Flag: EQ
如果不是,你得到了什麼? – leo 2014-10-07 08:08:49
你以後做了什麼? 「StringEscapeUtils.unescapeJava」調用背後的想法是什麼? – weston 2014-10-07 08:11:30
Im gettingE97A – colymore 2014-10-07 08:11:33