在隨後的Word2Vec Skip-gram設置中,輸出層的數據設置是什麼?它是一個零到處的矩陣,但每個C行中都有一個「1」 - 代表C語境中的單詞嗎?Word2Vec數據設置
添加描述數據設置問題:
含義數據集將是什麼樣子呈獻給了NN?讓我們認爲這是「單個訓練樣例的樣子」?我假設總共輸入是一個矩陣,其中每一行是詞彙表中的單詞(並且每個單詞也有一列,每個單元格爲零,除了特定單詞的位置 - 一個熱點編碼)?因此,如下所示,單個訓練示例爲1xV(除特定單詞外,全部爲零,其值爲1)。這與上面的圖片一致,即輸入是V-dim。我預計總輸入矩陣會有重複的行,但每次在語料庫中找到該單詞時(因爲輸出或目標變量會不同),將重複相同的單熱編碼矢量。
輸出(目標)更令我困惑。我預計它會精確地反映輸入 - 單個訓練示例具有「多」 - 熱編碼矢量,該矢量除非在單元格C中爲「1」,否則爲零,表示特定單詞在輸入的上下文中單詞(如果我們正在查看,則C = 5,例如,在給定輸入單詞實例之前2個單詞和3個單詞)。但圖片似乎並不認同這一點。我不明白什麼似乎共享相同的W'權重矩陣的C不同的輸出層?
你能解釋一下輸出的數據設置嗎? –
數據設置是什麼意思? – yvespeirsman
我剛剛添加到問題 - 謝謝! –