在發送到RNN之前應該將令牌<pad>,<unknown>,<go>,<EOS>的單詞向量發送給RNN？

在word嵌入中，start_tokens _PAD，_UNKNOWN，_GO，_EOS是什麼應該是一個好的向量表示？在發送到RNN之前應該將令牌<pad>,<unknown>,<go>,<EOS>的單詞向量發送給RNN？

2017-01-26 Wenchen Li

非常模糊的問題。輸入向量和目標向量都來自一組文本。然後，RNN學習代表*出現*代表單詞和文本之間關係的隱藏層的權重。 RNN的輸入向量通常是由[TF * IDF]（https://en.wikipedia.org/wiki/Tf%E2%80%93idf）或單詞詞彙加權的單詞 - 文檔共現矩陣共生矩陣（鄰居）。 – gerowam

如果您已經從google預訓練word2vec模型，並且您不想再次訓練嵌入，應該使用什麼向量。它應該是僅僅是零的矢量還是不同的東西？ – Cospel

據我瞭解，你可以用任何矢量來表示這些標記。

這裏的原因：

輸入的字序列到模型，首先每個單詞轉換爲一個ID，然後看看你的埋設 - 矩陣向量對應於該ID。用那個矢量，你訓練你的模型。但嵌入矩陣只包含可訓練的權重，這些權重將在訓練期間進行調整。來自您的預訓練載體的矢量表徵只是一個很好的觀點，可以開始產生良好的結果。

因此，開頭的代表您的特殊代幣在訓練過程中會發生變化，這並不重要。

來源

2017-11-16 13:15:27 spettekaka

在發送到RNN之前應該將令牌<pad>,<unknown>,<go>,<EOS>的單詞向量發送給RNN？

回答

相關問題