我遇到了字符編碼方面的一些問題,並且在波蘭字符的這種特殊情況下。Python波蘭字符編碼問題
我需要用windows-1252等價物替換所有的非windows-1252字符。我有這個工作,直到我需要使用波蘭人的角色。我該如何替換這些字符?
例如é
是一個windows-1252字符,必須保持這種方式。但ł
不是一個Windows-1252字符,必須用其等價物替換(或剝離,如果它沒有等效)。
我嘗試這樣做:
import unicodedata
text = "Racławicka Rógé"
tmp = unicodedata.normalize('NFKD', text).encode('ascii', 'ignore')
print(tmp.decode("utf-8"))
此打印:
Racawicka Roge
但現在ó
和é
都編碼成o
和e
。
我該如何解決這個問題?
我在想什麼......非常感謝!這正是我所需要的!想想很難! – Timo002 2014-12-04 15:35:54