代碼是在Python中。我把python中的二進制模型加載到gensim中,01使用「init_sims」選項來加快執行速度。操作系統是OS X. 裝載它需要將近50-60秒。和相當的時間找到「most_similar」。這是正常的嗎?在使用init_sims選項之前,花費了將近兩倍的時間!我有一種感覺可能是OS RAM分配問題。Word2Vec:使用Gensim和Google新聞數據集 - 非常慢的執行時間
model=Word2Vec.load_word2vec_format('GoogleNewsvectorsnegative300.bin',binary=True)
model.init_sims(replace=True)
model.save('SmallerFile')
#MODEL SAVED INTO SMALLERFILE & NEXT LOAD FROM IT
model=Word2Vec.load('SmallerFile',mmap='r')
#GIVE RESULT SER!
print model.most_similar(positive=['woman', 'king'], negative=['man'])
嘗試在你訓練時在cbow和ngram之間切換。 – AbtPst