在多個出版物中描述這個問題涉及在CNN使用位置矢量的關係分類,如以下通過Zeng等人:http://www.aclweb.org/anthology/C14-1220創作卷積神經網絡的位置矢量的關係分類
我想在張量流中實現這樣一個模型。我的問題如下:
使用隨機初始化向量表示位置信息有什麼好處嗎?舉例來說,爲什麼不用一個熱門的矢量編碼來表示位置?不建議將單熱矢量與密集的單詞矢量結合起來嗎?
根據單詞向量的維度,位置向量應該具有最小維度嗎?例如,假設單詞向量維數爲500,那麼對於位置向量來說,維數10是否會太小而不能在模型中有效?是否有一系列已知的位置向量表現良好的維度?
用於編碼位置信息的隨機初始化向量之間的距離是否重要?
非常感謝您花時間研究這一點!