2016-12-14 97 views
0

我使用word2vec,wiki語料庫我受過訓練,如果輸入的單詞不在word2vec的詞彙表中,我該怎麼辦?KeyError:單詞'詞彙'不在詞彙表中'word2vec

測試這一點:

model = word2vec.Word2Vec.load('model/' + 'wiki_chinese_word2vec.model')  
model['boom'] 

錯誤:

KeyError("word '%s' not in vocabulary" % word)

+0

檢查'如果「潮」模型'取回之前。 – DyZ

+0

這是一個很好的例子,我在wiki的語料庫中檢查了我想要的單詞,但在模型中沒有。 –

回答

0

當你說

what can I do if the word I input not in vocabulary in word2vec

我解釋這兩種方式

1)如何逃避這個例外:你可以使用try,catch

2)如何處理這個例外情況:重新訓練模型,再次容納丟失的單詞。你可以選擇增量訓練模型,新的語料庫,在word2vec中,請詳細閱讀gensim教程。

我推測,「潮」不可用,你已經通過了主體,因此麻煩

2

嘗試使用*嘗試& *除了

try: 
     c = model['boom'] 
except KeyError: 
     print "not in vocabulary" 
     c = 0