使用nltk pos tagger時出現錯誤的zip文件錯誤

我想使用NLTK POS-tagger，但得到「zipfile.BadZipfile：文件不是zip文件」錯誤。使用nltk pos tagger時出現錯誤的zip文件錯誤

誤差來源於此代碼：

import nltk 
sentence = "I love python" 
tokens = nltk.word_tokenize(sentence) 
pos_tags = nltk.pos_tag(tokens) 
print nltk.ne_chunk(pos_tags, binary=True)

我發現this question有關我的問題。不幸的是我無法下載整個語料庫，因爲我在服務器上工作並且有很多內存限制。有人可以將我指向我需要的特定文件，因此我可以下載該文件而不是整個語料庫嗎？

（我使用Python 2.7.6）

來源

2015-05-02 Shiv

嘗試這些：

nltk.download("maxent_treebank_pos_tagger") 
nltk.download("maxent_ne_chunker") 
nltk.download("punkt")

前兩個分別是詞性標註和命名實體。第三，你沒有在你的代碼示例中使用，但你需要爲nltk.sent_tokenize()，它將純文本分解成句子。既然你與POS標籤一起工作我也想下載這些（他們是微小的）：

nltk.download(["tagsets", "universal_tagset"])

如果你有一點空間，在下載完整的「書」收集會給你一切你需要探索NLTK。

來源

2015-05-03 00:19:08 alexis

使用nltk pos tagger時出現錯誤的zip文件錯誤

回答

相關問題