當談到正常的人工神經網絡或任何標準機器學習技術時,我理解訓練,測試和驗證集應該是什麼(概念上和經驗法則比率)。但是,對於雙向LSTM(BLSTM)網絡,如何分割數據令我感到困惑。雙向LSTM(BLSTM)的訓練,測試和驗證集
我在嘗試改進由受監視的健康值組成的個別主題數據的預測。在最簡單的情況下,對於每個主題,有一個長時間系列值(> 20k值),並且該時間系列的連續部分根據主題的當前健康狀況從一組類別進行標記。對於BLSTM,網絡將同時訓練所有數據向前和向後。那麼問題是,如何爲一個主題分割時間序列?
- 我不能只取最後的2,000個值(例如),因爲它們可能都屬於一個類別。
- 我無法隨機將時間序列切碎,因爲然後學習和測試階段都是由不相關的塊組成。
最後,每個主題(據我所知)略有不同(但相似)的特點。所以,也許,因爲我有成千上萬的科目,我是否訓練一些,測試一些並驗證其他人?但是,由於存在主體間差異,如果我只考慮一個主題開始,我將如何設置測試?