如何從一行中刪除標點符號,但保留標點符號使用re ??保留標點符號
例如:
Input = "Hello!!!, i don't like to 'some String' .... isn't"
Output = (['hello','i', 'don't','like','to', 'some', 'string', 'isn't'])
我試圖做到這一點:
re.sub('\W+', ' ', myLine.lower()).split()
但這分裂像 「不」 到唐和t。
搜索空格+'或'+空格而不是\ W。 – JulienD
@JulienD:感謝您的快速回復!!我對Python和RegEx是一種新手!!所以我不明白你的意思!!你的意思是這樣的:「re.sub('+','' ,myLine.lower())。split())「 –
拆分並去掉標點符號 –