如何使用預先訓練的單詞向量創建gensim word2vec模型？

我使用分佈式word2vec算法創建了詞向量。現在我有單詞和相應的向量。如何使用這些單詞和向量來構建gensim word2vec模型？如何使用預先訓練的單詞向量創建gensim word2vec模型？

2017-10-12 Uma Maheswara Rao Pinninti

我不確定您是否使用gensim或其他工具創建了word2vec模型，但是如果正確理解您的問題，則只需使用gensim加載word2vec模型。這是通過以下方式進行：

import gensim 
w2v_file = codecs.open(WORD2VEC_PATH, encoding='utf-8') 
model = gensim.models.KeyedVectors.load_word2vec_format(w2v_file, binary=True) # or binary=False if the model is not compressed

但是，如果你想要做的是培養word2vec使用純gensim這裏從頭模型（即從原始文本）是一個tutorial on how to train word2vec model using gensim。

來源

2017-10-12 09:33:25 sophros

謝謝，這正是我正在尋找的。 –

您能否提供示例w2v_file或幫助我生成該格式？我將這個單詞和它的向量放在一個由空格和單詞分隔的行中，並用行分隔。謝謝。 @sophros –

你有沒有嘗試過以下方法？'from gensim.models import word2vec model = word2vec.Word2Vec.load_word2vec_format（'path/to/GoogleNews-vectors-negative300.bin'，binary = False）' 重要的部分是'binary = False'。 – sophros

如何使用預先訓練的單詞向量創建gensim word2vec模型？

回答

相關問題