0
我有一個訓練有素的300尺寸的geinsim模型的word2vec模型,並希望將尺寸切割爲100(簡單地刪除最後200個尺寸)。什麼是使用python最簡單和最有效的方法?Gensim Word2Vec模型:切割尺寸
我有一個訓練有素的300尺寸的geinsim模型的word2vec模型,並希望將尺寸切割爲100(簡單地刪除最後200個尺寸)。什麼是使用python最簡單和最有效的方法?Gensim Word2Vec模型:切割尺寸
您可以將輸出模型保存在word2vec format中。確保將其保存爲文本文件(.txt)。 word2vec格式如下
第一行是<vocabulary_size> <embedding_size>
。在你的情況下,<embedding_size>
將是300
。 其餘的行將是<word><TAB><300 floating point numbers space separated>
。現在你可以很容易地用python解析這個文件,並丟棄每一行的最後200個浮點數。確保在第一行中更新<embedding_size>
。將其另存爲新文件(可選)。現在您可以使用load_word2vec_format()將這個新文件加載爲新的word2vec模型。
如果能解決您的問題,請立即聯繫我們。