我要去thorugh本文http://cs.stanford.edu/~quocle/paragraph_vector.pdf如何gensim計算doc2vec款載體
,並指出
「Theparagraph向量和詞矢量的平均值或級聯 預測在上下文中的下一個字在實驗中,我們使用 級聯作爲組合向量的方法。「
串聯或平均是如何工作的?
例如(如果第1段包含WORD1和單詞2):
word1 vector =[0.1,0.2,0.3]
word2 vector =[0.4,0.5,0.6]
concat method
does paragraph vector = [0.1+0.4,0.2+0.5,0.3+0.6] ?
Average method
does paragraph vector = [(0.1+0.4)/2,(0.2+0.5)/2,(0.3+0.6)/2] ?
從該圖像
另外:
據指出:
該段令牌可以被認爲是另一個詞。它充當一個 內存,它記住了當前上下文中缺少的內容 - 或者該段落的主題 。出於這個原因,我們經常稱段落矢量的分佈式存儲器模型(PV-DM)爲 。
段落標記是否等於段落向量等於on
?