0

在深度學習文獻中,我遇到了很多使用堆疊式RNN(堆疊LSTM)網絡的例子,雖然探索了細胞本身的細節,但通常沒有關於堆疊式架構中的不同層是否共享權重的信息或不。確實堆疊lstm或堆疊RNN要求默認情況下跨層分享權重?

我試圖理解的是,當作者沒有指定這個時,默認行爲是什麼?我們是否應該假設他們已經分享了各層的權重?或者每個圖層都有它自己的一組權重來表示它的單元格?

回答

0

假設是每層都有自己的一組權重。參見第4頁here上的等式(1)和(2)。正如你所看到的,權重取決於圖層(這裏的方程與vanilla rnn有關,但LSTM也完成了相同的假設)。