2016-11-06 132 views
0

我試着運行這段代碼:NLTK錯誤加載模塊

import nltk 


text = "Mrs. Hudson made a cup of tea. She is a wonderful woman." 
sentences = nltk.tokenize.sent_tokenize(text)#breaks statement into  
print sentences 
#print tokens 
tokens = [nltk.tokenize.word_tokenize(s) for s in sentences]#tokenizes sentences passes as list of lists 

PosTokens = [nltk.pos_tag(e) for e in tokens] 

當我運行它,我得到一個錯誤:

Traceback (most recent call last): 
    File "<stdin>", line 1, in <module> 
NameError: name 'averaged_perceptron_tagger' is not defined 

於是我運行下載得到的惡搞和每個這個問題我需要 'maxtent_treebank_pos_tagger' nltk pos_tag usage

,我得到以下幾點:

nltk.download('maxtent_treebank_pos-tagger') 

NameError: name 'averaged_perceptron_tagger' is not defined 
>>> nltk.download('maxtent_treebank_pos-tagger') 
[nltk_data] Error loading maxtent_treebank_pos-tagger: Package 
[nltk_data]  'maxtent_treebank_pos-tagger' not found in index 
False 

因此,我非常感謝所有幫助!

+0

你的問題是一個錯字:它的 「MAXENT」(最大熵),而不是 「maxtent」。 – alexis

+0

[nltk_data]加載maxent時出錯:未找到包中的'maxent' False –

+1

@alvas這是一個關於拼寫錯誤的問題,而不是關於如何使用標記的重複。 – alexis

回答

0

我想通了,我輸入一個錯字

其nltk.download(maxent_treebank_pos_tagger)