我首先使用L.LSTM,後來我發現這個NStepLSTM,這是官方教程文檔的露出部分。 https://docs.chainer.org/en/stable/reference/generated/chainer.links.NStepLSTM.html?highlight=Nstep爲什麼NStepLSTM沒有reset_state方法?
爲什麼chainer.links.NStepLSTM或chainer.links.NStepBiLSTM沒有reset_state?如何reset_state?
是它傳遞的序列(每一個是一個序列chainer.Variable,例如一個文章包含多個單詞是一個變量)的列表?這個類的目的是處理不同的長度序列嗎?
才能使用截斷BPTT以節省內存chainer.links.NStepLSTM?
你的意思是使用NStepLSTM時,我不需要寫BPTT更新?我必須實現一種情況,其中NStepLSTM的每個時間步的輸出將被連接,然後爲下一層的饋送輸入(NStepLSTM之後的層將使用NStepLSTM的所有時間步),在這種情況下,如何編寫BPTT更新程序?或者你的意思是我不需要明確寫入BPTT更新程序? – machen
做變量列表的NStepLSTM輸入:該列表中的每個變量之間需要有時間相關性? – machen
如果我只想用最後一步計算損失,因爲NStepLSTM返回3個變量,我應該使用最後一個還是第一個? – machen