Recentrly刪除口音,我發現非常有用的方法StringUtils的圖書館是從字符串
StringUtils.stripAccents(String s)
我發現它真的有用以消除任何特殊字符並將其轉換爲一些ASCII「等價物」,對於instace C = C等
現在我正在爲德國客戶誰真的需要做這樣的事情,但只爲非德語字符工作。任何變音都應該保持不變。我意識到在這種情況下,絃樂器不會有用。
有沒有人有這方面的經驗? 是否有任何有用的工具/庫/類或正則表達式? 我試着寫一些類,這是分析和更換等字符,但它可以建立這樣的地圖所有的語言非常困難......
任何建議appriciated ...
它似乎有檢測所使用的語言的功能。你能澄清這將如何幫助? – eis
你可以有原始字符串作爲輸入,把語言檢測到德國,然後將檢測到德國的字符,並丟棄剩餘 –