如何轉換像「拉丁小字母E」+「組合ACUTE ACCENT」(或U + 0075 + U + 0301)這樣的分解的Unicode字符序列,使它們成爲預分解形式:「LATIN SMALL LETTER E WITH ACUTE「(或U + 00E9)使用本機Python 2.5+函數?在Python中預編碼Unicode字符序列
如果有問題,我在Mac OS X(10.6.4)上,我看到Converting to Precomposed Unicode String using Python-AppKit-ObjectiveC這個問題,但不幸的是,雖然所描述的OS X原生CoreFoundation函數CFStringNormalize
不會失敗或暫停腳本執行,但它不會做任何事情。因此,我並不是說它不會返回任何東西(它的返回類型是無效的 - 它在原地發生變化)。我也嘗試了常量參數的所有可能的值,這些常量參數指定以規範或非規範形式的預組合或分解。
這就是爲什麼我正在尋找一種處理這種情況的Python本地方法。
非常感謝您的閱讀!
安德烈
相關:http://stackoverflow.com/questions/446222/how-do-i-reverse -unicode-decomposition-python – kennytm 2010-10-02 13:40:49
也感謝你Kenny,添加了交叉引用。 – andreb 2010-10-02 14:13:59