2017-10-16 30 views

回答

1

通過load_word2vec_format()加載不包括字數的單一文件格式 - 所以他們不能出現在加載的對象。

儘管如此,通常的慣例是將這些文件置於最頻繁到最不頻繁的順序。因此,如果沒有真正的計數信息,則會使用從詞彙大小減小到1的插值。(這就是您看到的詞索引有點像的數字。)

某些軟件有一種方法將額外信息保存在單獨的文件中 - 請參閱gensim的save_word2vec_format()load_word2vec_format()fvocab選項。所以也許你的載體已經有了,你可以使用這個選項。