我試圖使用編譯的正則表達式匹配並從列表中刪除列表中的所有單詞,但我努力避免單詞中的出現。從python列表中刪除字符串中出現的所有字詞
電流:
REMOVE_LIST = ["a", "an", "as", "at", ...]
remove = '|'.join(REMOVE_LIST)
regex = re.compile(r'('+remove+')', flags=re.IGNORECASE)
out = regex.sub("", text)
在:
出 「敏捷的棕色狐狸比一隻螞蟻躍升」:「敏捷的棕色狐狸跳過T」
預期:「快速的棕色狐狸跳過」
我試圖改變字符串編譯以下,但無濟於事:
regex = re.compile(r'\b('+remove+')\b', flags=re.IGNORECASE)
任何建議或我思念的東西華麗地明顯?
想必'ant'是屬於你刪除列表? – 2013-03-15 15:07:57