只需閱讀gensim頁面上的doc2vec命令即可。gensim doc2vec「intersect_word2vec_format」命令
我很好奇命令「intersect_word2vec_format」。
我對這個命令的理解是,它允許我將預訓練的word2vec模型中的矢量值插入到我的doc2vec模型中,然後使用預訓練的word2vec值訓練我的doc2vec模型,而不是從我的文檔語料庫生成單詞矢量值。結果是我得到了一個更準確的doc2vec模型,因爲我使用的pretrained w2v值是從比我的相對較小的文檔語料庫更大的語料庫中生成的。
我對這個命令的理解是正確的還是不正確的? ;-)
非常感謝您的詳細解答。它爲我清理了很多東西。我現在可以開始使用PV-DM訓練我的第一個d2v模型:) :) –