0
我正在做一些文字處理,我需要的所有文字處理轉換爲小寫,但文本是法國人,我需要保持所有的變音符號,讓「E」將被轉換爲「è」等。如果它有幫助,我實際上不需要最終的輸出文本,只是每個獨特字符的標識符(例如數字)(其中「e」和「è」是不同的字符)。有什麼建議麼?與字符串大小寫變音符號,並在Python
我正在做一些文字處理,我需要的所有文字處理轉換爲小寫,但文本是法國人,我需要保持所有的變音符號,讓「E」將被轉換爲「è」等。如果它有幫助,我實際上不需要最終的輸出文本,只是每個獨特字符的標識符(例如數字)(其中「e」和「è」是不同的字符)。有什麼建議麼?與字符串大小寫變音符號,並在Python
使用Unicode字符串:
>>> u"É".lower()
'é'
我覺得你的問題是,要轉換爲ASCII碼。 如果你嘗試類似
word = u"HÈLLO"
print word.lower()
應該這樣做
哪一種Python版本? –