1
上面「a」的變音符號是不是應該被正則表達式去掉?如何獲得Ruby 1.9 regexp支持 p {Nonspacing_Mark}?
"hǎo".gsub(/\p{Nonspacing_Mark}/, '')
=> "hǎo"
"hǎo".gsub(/\p{Mn}/, '')
=> "hǎo"
更新:
我種從它的工作原理在Java中得到它。
Normalizer.normalize("hǎo", Form.NFD).replaceAll("\\p{Mn}+", "")
我需要首先進行歸一化,將「ǎ」分成「a」和變音符號。
看看這個http://stackoverflow.com/questions/3571480/converting-chinese-to-pinyin – abi1964 2011-04-19 11:29:11
紅寶石是否知道你的源代碼是UTF-8? – tchrist 2011-04-19 14:55:28
你是否想要這個邪惡,因爲你不知道如何比較兩個字符串的「重音不敏感」時尚? – tchrist 2011-04-23 22:42:07