我的應用程序還支持旁遮普語(\ u0A00- \ u0A7F) 我嘗試下面的代碼定期爲UTF-8的語言表達
Pattern classPattern = Pattern.compile("\u0A00-\u0A7F ");
Matcher classMatcher = classPattern.matcher("ਭਾਸ਼ਾ ਸੰਦ");
if (classMatcher.find()) {
System.out.println("yes");
}else{
System.out.println("no");
}
我得到「沒有」的輸出,雖然我在匹配提供的旁遮普本地字符( )
有什麼想法爲什麼?
而不是使用文字`[\ u0A00- \ u0A7F]`,爲什麼不使用`\ p {InGurmukhi}`而不是?這是現在的象徵,而不是一個神奇的數字,這是可取的。你可以單獨在正則表達式中使用它,或者作爲封閉字符類的一部分。 – tchrist 2011-01-13 14:46:34