2012-06-20 22 views
2

任何方式使train()與數據的自定義列車/測試分區運行?我感興趣的是回測時間序列數據(用於傳統重採樣/ CV /等不適當/泄漏時)。即如果數據的時間從1 ... N開始排序,那麼我會在某個截止點之前對數據進行重複訓練,以預測截止點之後的數據(直至某個滑動窗口大小)。我無法確定如何在利用其餘部分插入符號的同時取消關閉此插入符號train()。預先感謝任何提示。插入符號trainControl中的後測或自定義分割?

回答

4

Max在這裏。

您可以在trainControl(index = list())中指定自定義重採樣索引,其中列表中包含用於訓練的訓練數據元素。

...但火車()將使用其他所有東西作爲支撐,我不認爲這就是你想要的。

我可能有大約10個不同的請求這個功能。訓練()需要做一些修改,但它不應該太糟糕。但是,1)我不知道傑克關於時間序列分析(超越簡單的基礎知識),所以一些具有一個或兩個測試示例的原型代碼將會有幫助,並且2)直到我完成本書(大約4個月)真的沒有時間做到這一點。

所以,如果你願意貢獻一些技術性的東西,並且可以等待幾個月(這可以根據你想要的主動性而降低),那麼可以做一些修改。

如果您想進一步討論,請發郵件至包裝上列出的地址。

+1

我只是想指出,脫字符號現在在'trainControl'中包含'indexOut',它允許您在每次摺疊中指定用於測試集的索引。您可以使用新的'createTimeSlices()'函數進行時間序列交叉驗證(或反向測試)。 – Zach

相關問題