2016-07-29 46 views
1

建立不跨越語句邊界的循環語言模型(例如LSTM)的最佳方法是什麼?或者更一般地說,如果你向模型展示一個批次,每一行都包含多個句子,你怎麼能在看到每個句子後重置狀態?有沒有可以指定給模型的特殊標記?batch =句級語言模型中的TensorFlow復位狀態

謝謝!

回答

0

如果這些句子是獨立的,那麼讓批處理中的每一行只包含一個句子會更簡潔。然後,您可以在每批後重置LSTM的狀態,如this question的答案中所述。