我想從使用python nltk包的文本中提取名詞。它或多或少的工作。但我想知道如何擺脫單詞末尾的非字母字符?請看下面的例子。如何擺脫這個詞的末尾非字母字符使用python nltk
from nltk.tag import pos_tag
x = "Back, Back: Back"
tagged_sent = pos_tag(x.split())
y = [word for word,pos in tagged_sent if pos == 'NNP']
那麼y取值
['Back,', 'Back:', 'Back']
我真正想要的是
['Back', 'Back', 'Back']