2017-03-09 81 views
1

我已經實施了一個使用Seq2Seq方法的音譯LSTM網絡。但是它只給出給定輸入序列的一個輸出序列。我看不到如何使用LSTM網絡獲得多個輸出序列及其相關的概率值。或者,如果甚至有可能使用這種方法獲得多個解決方案。我有一個英語單詞形式的訓練數據,這些單詞用英語以外的第二語言翻譯。我可以看到,人們一直在使用LSTM來解決下一個單詞建議等問題,在這個問題上可以有多個答案。因此音譯也應該可以達到同樣的效果。如何從相同輸入序列的Seq2Seq的LSTM獲取多個輸出?

回答

1

您可以使用「波束搜索」方法生成可變結果。

有很多介紹它的材料,這裏有一篇由CMU編寫的「神經機器翻譯和序列模型:教程」,第7.2章。

最近,tensorflow seq2seq模型實現了波束搜索清楚,您可以參考Tensorflow-seq2seq-BeamSearchDecoder