2014-12-23 21 views
1

我已經安裝了nlpnet(http://nilc.icmc.usp.br/nlpnet/),但我找不到它需要的metadata_pos.pickle文件來運行一部分的語音標記器。該文件似乎不在我的機器上,並且未包含在當前的github存儲庫中。
有什麼建議?nlpnet從哪裏得到它的元數據pickle文件?

+0

只是一個盲目的嘗試'nltk.download('all')'。你得到的錯誤是什麼? – alvas

+0

你有沒有從http://nilc.icmc.usp.br/nlpnet/models.html下載模型?順便說一句,你是如何得到通過導入錯誤:https://github.com/erickrf/nlpnet/issues/2? – alvas

回答

-1

訓練模型,你需要的例子,每行一個句子,有一個下劃線串接令牌和標籤:

This_DT is_VBZ an_DT example_NN 

使用這個命令你的文集,你會產生數據使用POS惡搞(包括metadata_pos.pickle)需要:如果你想使用一個已經訓練模型

nlpnet-train.py pos --gold /path/to/training-data.txt 

,他們有一個here。它是用Mac-Morpho語料庫(一種巴西葡萄牙語新聞語料庫)進行培訓/評估的,所以它可能不適用於其他語言。