如何保留åäö但從字符串中刪除所有其他非字母數字字符? (我發現類似的問題,但似乎沒有一個正確的答案。)從字符串中刪除非字母數字,但保留編碼的非ASCII字符åäö
我試圖擴展正則表達式試圖讓它跳過åäö在子,但它似乎只是使正則表達式停止工作,讓空白這樣留下來。 我通常不用python編程,只是想幫助朋友出去,所以可能有更好的方法來清理字符串,而不是使用re。
從谷歌搜索我認爲它與Unicode有關,但沒有好的解決方案。
def ordnaText(text):
text = text.lower()
text = re.sub('\W', '', text)
if text.isalnum() == True:
return text
這是Python 2還是3? –
它在2.7.x編碼 –
'type(文本)'是什麼? – Eric