我試圖用循環神經網絡來預測單詞。 我正在訓練網絡,將獨立預訓練的word2vec
字作爲輸入。rnn使用word2vec進行單詞預測
我想知道是否可以使用目標詞的word2vec
來計算錯誤代價。 它似乎不工作,我從來沒有見過這樣的例子或論文。 是否可以使用word2vec作爲計算錯誤成本的目標值? 如果是這樣,我應該使用什麼樣的成本函數? 如果不是,請以數學方式解釋原因。
我應該如何設置輸入和目標? 現在我使用的架構如下圖所示:
input : word1, word2, word3, target : word4
input : word1, word2, word3, word4, target : word5
也許我可以像使用其他選項:
input : word1, word2 target : word2, word3
input : word1, word2, word3, target : word2, word3, word4
哪一個更好?還是有另一種選擇?
如果有任何參考讓我知道。
感謝您編輯我的問題。 應該更關心標籤嗎?標記。 –