對於基本多語言平面中的字符,我們可以使用'\ uxxxx'轉義它。例如,您可以使用/ [\ u4e00- \ u9fff] /來匹配一個普通的中文字符(0x4e00-0x9fff是CJK Unified Ideographs的範圍)。如何從基本多語言平面中逃離角色?
但是對於超出基本多語言平面的字符,它們的代碼大於0xffff。所以你不能使用格式'\ uxxxx'來轉義它,因爲'\ u20000'表示字符'\ u2000'和字符'0',而不是代碼是0x20000的字符。
如何從基本多語言平面中轉義字符?直接使用這些字符不是一個好主意,因爲它們不能以大多數字體顯示。
@millimoose呃,但這個問題是關於** javascript **,而不是java。 – user805627
哎呀,我的壞。(儘管如此,你可能已經被搞砸了;如果不是更多的話) – millimoose
相關:[BMP以外的JavaScript字符串](http://stackoverflow.com/questions/3744721/javascript-strings-outside-of-the -BMP) – millimoose