我給的例子來自土耳其,例如「şğüı」變成「sgui」有沒有辦法將unicode轉換爲最接近的ASCII碼?
我敢肯定,每一種語言都有它自己的轉換方法,有時一個字符可能被轉換到多個ASCII字符,如「阿爾法」 /「披」等
我不知道是否有一個庫/方法實現這種轉換
我給的例子來自土耳其,例如「şğüı」變成「sgui」有沒有辦法將unicode轉換爲最接近的ASCII碼?
我敢肯定,每一種語言都有它自己的轉換方法,有時一個字符可能被轉換到多個ASCII字符,如「阿爾法」 /「披」等
我不知道是否有一個庫/方法實現這種轉換
你所要求被稱爲音譯。
試試Unidecode庫。
Unidecode有沒有非GPL的替代品? – Rjak
@Rjak:這個[回答](https://stackoverflow.com/a/1207479/865874)由MartínMuñozdelRío鏈接。它使用屬於Python標準庫的'unicodedata'。 – rodrigo
你好@rodrigo - unicodedata的問題在於它是替代品,而不是音譯。對於我們的應用程序,最好能找到最接近的「等效」ASCII字符(即音譯)。例如,使用拉丁名字「Piekło」,Unidecode會返回「Pieklo」,這就是我們想要的。根據您傳遞的行爲參數,Unicodedata返回「Pieko」(刪除)或「Piek?o」(替換)。 – Rjak
你的意思是這裏的第一個答案:http://stackoverflow.com/questions/1207457/convert-a-unicode-string-to-a-string-in-python-containing-extra-symbols? –
@MartínMuñozdelRío是的,正好,謝謝 –