2
在word嵌入中,start_tokens _PAD,_UNKNOWN,_GO,_EOS是什麼應該是一個好的向量表示?在發送到RNN之前應該將令牌<pad>,<unknown>,<go>,<EOS>的單詞向量發送給RNN?
在word嵌入中,start_tokens _PAD,_UNKNOWN,_GO,_EOS是什麼應該是一個好的向量表示?在發送到RNN之前應該將令牌<pad>,<unknown>,<go>,<EOS>的單詞向量發送給RNN?
據我瞭解,你可以用任何矢量來表示這些標記。
這裏的原因:
輸入的字序列到模型,首先每個單詞轉換爲一個ID,然後看看你的埋設 - 矩陣向量對應於該ID。用那個矢量,你訓練你的模型。但嵌入矩陣只包含可訓練的權重,這些權重將在訓練期間進行調整。來自您的預訓練載體的矢量表徵只是一個很好的觀點,可以開始產生良好的結果。
因此,開頭的代表您的特殊代幣在訓練過程中會發生變化,這並不重要。
非常模糊的問題。輸入向量和目標向量都來自一組文本。然後,RNN學習代表*出現*代表單詞和文本之間關係的隱藏層的權重。 RNN的輸入向量通常是由[TF * IDF](https://en.wikipedia.org/wiki/Tf%E2%80%93idf)或單詞詞彙加權的單詞 - 文檔共現矩陣共生矩陣(鄰居)。 – gerowam
如果您已經從google預訓練word2vec模型,並且您不想再次訓練嵌入,應該使用什麼向量。它應該是僅僅是零的矢量還是不同的東西? – Cospel