我想知道如何替換除特定選定字符之外的所有正則表達式匹配。替換除特定字符之外的所有正則表達式匹配
我需要清理數據。該數據的一個例子是
`some-really,dirty.data%#$_.`
,我想看起來像
some-reallydirtydata_
注some
和really
之間的-
。這是我選擇的角色,我會不是喜歡刪除。
這裏是我的代碼片段:
import re
unclean_string = "some-really,dirty.data%#$_."
clean_string = re.sub('\W', '', unclean_string)
print clean_string
>>>"somereallydirtydata_"
我知道\W
刪除所有,但 「0〜9,A到Z,A到Z,並強調」。
我想知道我如何刪除所有這些,再加上一個選定的字符(如-
)。
聲明:我提前道歉提出這樣一個基本問題。我是Python新手,使用正則表達式。