貪婪的解碼器RNN和k = 1的波束解碼器有什麼區別？

給定一個狀態向量，我們可以通過連續生成每個輸出來以貪婪的方式遞歸地解碼一個序列，其中每個預測以先前的輸出爲條件。我最近讀了一篇論文，描述了在光束大小爲1（k = 1）的解碼過程中使用波束搜索。如果我們只保留每一步的最佳輸出，是不是像貪婪解碼一樣，並且沒有提供波束搜索通常提供的好處？貪婪的解碼器RNN和k = 1的波束解碼器有什麼區別？

來源

2016-09-14 jstaker7

終於找到了答案：1的光束大小與貪心搜索相同。

從「細緻周到的迴歸神經網絡的寫意一句話總結」：

"k refers to the size of the beam for generation; k = 1 implies greedy generation."

來源

2016-09-17 05:58:00 jstaker7

貪婪的解碼器RNN和k = 1的波束解碼器有什麼區別？

回答

相關問題