0
我知道將數據分離爲訓練和測試提供了一種方法來評估模型在看不見的數據情況下的表現。時間系列Python ARIMA(測試,培訓和預測數據中可用的過去日期)
我正在訓練ARIMA模型,並且每天的數據都是從10月1日到11月22日。我有興趣在12月14日預測一些指標。難道我
- 列車上的所有可用數據,並使用預測(「2015年11月23日」,「二○一五年十二月十四日」)或
- 拆分數據到訓練和測試,以獲得性能指標和使用模型訓練集(從10月1日到11月7日),做一個預測,包括測試數據以及未來的日期,例如預測( '2015年11月8日', '2015年12月14日')。
我希望我的問題很有意義,如果您覺得這樣很混亂,我們很樂意澄清。
謝謝!