對於全名 - >用戶名轉換,我需要一個映射UTF-8 - > ASCII。非ASCII字符的漂亮ASCII表示?
例如: 邁克爾馬茲==>邁克爾麥爾茲==> michael.maerz
以及羅馬的中國文字
是否有庫或東西,可以實現這一點?
對於全名 - >用戶名轉換,我需要一個映射UTF-8 - > ASCII。非ASCII字符的漂亮ASCII表示?
例如: 邁克爾馬茲==>邁克爾麥爾茲==> michael.maerz
以及羅馬的中國文字
是否有庫或東西,可以實現這一點?
將ä
轉換爲ae
只是其中一個ascii represantations。見http://en.wikipedia.org/wiki/%C3%84。
我認爲一個比較通用的方法是(假設你可以使用C#)
string Unaccent(string s)
{
return String.Join("", s.Normalize(NormalizationForm.FormD)
.Where(c => char.GetUnicodeCategory(c) != UnicodeCategory.NonSpacingMark)
).Normalize(NormalizationForm.FormC);
}
Michael März
=>Michael Marz
對於那些編程語言? –
另外,哪些口語? 「這封信Ä...芬蘭語和土庫曼語總是[æ];瑞典語和愛沙尼亞語的地區差異,以及字母在單詞中的位置,都可以[æ]和[ɛ]。爲[ɛ]「:http://en.wikipedia.org/wiki/%C3%84 –
編程語言偏好按降序排列:Scala,Java,Python,PHP,... – ideaboxer