我準備好去我已經訓練過的word2vec模型。我已經連載它作爲一個CSV文件:如何在gensim中加載預先訓練好的模型並使用它訓練doc2vec?
word, v0, v1, ..., vN
house, 0.1234, 0.4567, ..., 0.3461
car, 0.456, 0.677, ..., 0.3461
我想知道什麼是我可以加載這個詞向量模型gensim
並用它來訓練一個段落或doc2vec模型。
這Doc2Vec tutorial說我可以加載一個「# C text format
」形式的模型,但我不知道這實際上是什麼意思。什麼是「C文本格式」在第一位,但更重要的是:
- 我怎樣才能加載我的word2vec模型,並將其用於doc2vec培訓?
如何從word2vec模型創建詞彙?
我無法證明這一說法,但我認爲如果提供預先訓練的單詞向量,文檔向量會更好地工作。我只通過評論相交部分並比較結果來測試這一點。但謝謝你提供了一個答案:) – displayname
什麼任務,與多少數據,哪些預先訓練的向量更好地工作? – gojomo