8
我正在嘗試使用NLTK和Python學習(英語)自然語言處理。 有沒有辦法在POS標籤期間或之後獲得動詞的不定式形式。如何使用NLTK(pos標記)獲得不定式形式的動詞
例如:
- 是(VBZ)=>是
- 提供(VBN)=>使用,以提供
- (VBG)=>可使用
我正在嘗試使用NLTK和Python學習(英語)自然語言處理。 有沒有辦法在POS標籤期間或之後獲得動詞的不定式形式。如何使用NLTK(pos標記)獲得不定式形式的動詞
例如:
關閉,你需要在開頭添加'to':
>>> from nltk.stem.wordnet import WordNetLemmatizer
>>> lemmatizer = WordNetLemmatizer()
>>> lemmatizer.lemmatize('is', 'v')
'be'
>>> lemmatizer.lemmatize('provided', 'v')
'provide'
>>> lemmatizer.lemmatize('using', 'v')
'use'
沒有一個完整的答案,但我會調查WordNet(是的,NLTK將WordNet作爲下載) – winwaed 2012-03-19 01:18:59