我試圖在將單詞分割爲詞的後綴和前綴(即詞素或詞綴)後得到一個列表。分割的正則表達式 - 將單詞拆分爲詞素或詞綴
我試過使用正則表達式,與re.findall
函數。
(如下所示)
>>> import re
>>> affixes = ['meth','eth','ketone', 'di', 'chloro', 'yl', 'ol']
>>> word = 'dimethylamin0ethanol'
>>> re.findall('|'.join(affixes), word)
['di', 'meth', 'yl', 'eth', 'ol']
然而,我需要在其中它不匹配被包括在部分。舉例來說,上面的例子將需要輸出:
['di', 'meth', 'yl', 'amin0', 'eth', 'an', 'ol']
有誰知道如何提取列表中的這些部分?