0
什麼是循環神經網絡(RNN)中的變長序列輸入的完整工作示例(不是片段)?你如何實現可變長度遞歸神經網絡?
例如,PyTorch可以實現將可變長度序列作爲RNN輸入,但似乎沒有完整工作代碼的例子。
相關: https://github.com/pytorch/pytorch/releases/tag/v0.1.10 https://discuss.pytorch.org/t/about-the-variable-length-input-in-rnn-scenario/345
你寫的部分不正確。 RNN旨在處理可變輸入。它不是網絡的限制,而是張量的限制(由pytorch設計)。如果您在每個訓練步驟(通過批量大小= 1)進行單個樣本,而無任何填充,則仍然可以將變量輸入傳遞給pytorch中的RNN。如果你想處理一個微型批處理,填充會起作用,並且由於張量在技術上不可能有任何尺寸可變的尺寸,所以你必須使用填充。 – entrophy
這沒有回答這個問題。顯然,每個網站都支持將可變長度序列分爲RNN:「nn.RNN,nn.LSTM,nn.GRU現在支持序列長度可變的小批量。」 – mikal94305
遞歸神經網絡中的變長輸入並不是指每個樣本的大小都是可變的,而是等長輸入序列的大小是可變的。想象一下學習單詞序列 - 您需要在切換到新句子時重置權重。句子可以是不同的長度 –