我使用this answer中的方法從單詞中刪除特殊字符並將其更改爲簡單形式。這對於許多基本的口音來說非常合適,例如爲什麼不把一些變音符刪除?
Malmö becomes "Malmo"
München becomes "Munchen"
Åge becomes "Age"
然而,這並不能在一些其他人物工作,例如:
Strømsgodset remains "Strømsgodset"
Kulħadd remains "Kulħadd"
是否有任何理由爲什麼這些字符不轉換的其他人一樣?
也就是有什麼辦法可以轉換成類似「組合拳」的字符,如:
æ -> ae
ẞ -> ss
因爲Unicode聯盟的語言學家和官僚們決定這樣做。 – xanatos
根據你的第二個問題,如何將它們映射到一對其他字符,使用'Dictionary'。然後很簡單:'foreach(var kv in dict)text = text.Replace(kv.Key.ToString(),kv.Value)' –
如果你知道世界上每種語言的所有特殊字符,那麼這將起作用。 – Gigi