1
我需要檢查一個字符串是否包含中文字符。 搜索後,我發現我必須看看這個模式的正則表達式\u31C0-\u31EF
, 但我不設法得到正則表達式的工作。檢查字符串是否包含CJK(中文)字符
任何有這種情況的經驗?正則表達式正確嗎?
我需要檢查一個字符串是否包含中文字符。 搜索後,我發現我必須看看這個模式的正則表達式\u31C0-\u31EF
, 但我不設法得到正則表達式的工作。檢查字符串是否包含CJK(中文)字符
任何有這種情況的經驗?正則表達式正確嗎?
正如所討論的here,在Java 7(即正則表達式編譯器符合requirement RL1.2 Properties from UTS#18 Unicode Regular Expressions),你可以使用下面的正則表達式匹配中國(當然,CJK)字符:
\p{script=Han}
可以appreviated簡單
\p{Han}
使用'「[\ u31C0- \ u31EF]」確實會匹配代碼點在0x31C0到0x31EF範圍內的任何字符。你需要方括號。我不知道實際數字是否正確;這個範圍只有48個字符,我認爲CJK比這個更多,但我知道什麼? – ajb
CJK中肯定有更多的字符,請參見[這裏](http://en.wikipedia.org/wiki/CJK_Unified_Ideographs)。 –
重複項未標記java標記。這真的是重複的嗎? – Suragch