我正在使用Scikit-Learn timeseriessplit將我的數據分割爲訓練和測試集。目前,timeSeries數據集的第一次分割是50%,接下來是25%之後的30%。我想要將一個固定的10%的數據用作測試集。Scikit-Learn:在timeseriessplit中測試大小
tscv = TimeSeriesSplit(n_splits=3)
for train_index, test_index in tscv.split(X):
print(train_index, test_index)
輸出是:
[ 0 1 2 ..., 1067 1068 1069] [1070 1071 1072 ..., 2136 2137 2138]
[ 0 1 2 ..., 2136 2137 2138] [2139 2140 2141 ..., 3205 3206 3207]
[ 0 1 2 ..., 3205 3206 3207] [..., 4274 4275 4276]
我想是這樣的:tscv = TimeSeriesSplit(n_splits=3, test_size= = 0.1)
類似train_test_split
。
如何才能將10%的條目拆分進行測試?
Timeseriessplit與其他cv迭代器的工作方式不同。你希望你的產出指數是什麼?例如,你是否仍然希望你的第三列車成爲你的第一和第二列車組的超集(因爲你使用的是timeseriessplit)? –