2012-03-18 48 views
8

我正在嘗試使用NLTK和Python學習(英語)自然語言處理。 有沒有辦法在POS標籤期間或之後獲得動詞的不定式形式。如何使用NLTK(pos標記)獲得不定式形式的動詞

例如:

  • 是(VBZ)=>是
  • 提供(VBN)=>使用,以提供
  • (VBG)=>可使用
+0

沒有一個完整的答案,但我會調查WordNet(是的,NLTK將WordNet作爲下載) – winwaed 2012-03-19 01:18:59

回答

15

關閉,你需要在開頭添加'to':

>>> from nltk.stem.wordnet import WordNetLemmatizer 
>>> lemmatizer = WordNetLemmatizer() 
>>> lemmatizer.lemmatize('is', 'v') 
'be' 
>>> lemmatizer.lemmatize('provided', 'v') 
'provide' 
>>> lemmatizer.lemmatize('using', 'v') 
'use'