在推文分析過程中,我運行的是包含\或/(可能在一個「詞」中出現多個外觀)的「單詞」。我想有這樣的話完全刪除,但無法真正抓住這個刪除帶有特殊字符「」和「/」的文字
這是我的嘗試:
sen = 'this is \re\store and b\\fre'
sen1 = 'this i\s /re/store and b//fre/'
slash_back = r'(?:[\w_]+\\[\w_]+)'
slash_fwd = r'(?:[\w_]+/+[\w_]+)'
slash_all = r'(?<!\S)[a-z-]+(?=[,.!?:;]?(?!\S))'
strt = re.sub(slash_back,"",sen)
strt1 = re.sub(slash_fwd,"",sen1)
strt2 = re.sub(slash_all,"",sen1)
print strt
print strt1
print strt2
我想獲得:
this is and
this i\s and
this and
但是,我得到:
and
this i\s/and/
i\s /re/store b//fre/
要添加:在這種情況下,「單詞」是一個字符串,由空格或標點符號分隔ns(如普通文字)
精美的問的問題。我希望有一個問題模板,提問者不得不採用類似的方式。 – d0nut
@iismathwizard我不得不重新加載頁面來仔細檢查我的眼睛是否正確 –