我需要將數據幀拆分爲10個部分,然後使用一個部分作爲測試集並保留9(合併爲用作訓練集),我有在我能夠分割數據集的地方找到下面的代碼,並且在選擇其中的一個之後嘗試合併其餘的集合。 第一次迭代沒問題,但在第二次迭代中我得到了下面的錯誤。將數據幀拆分爲10個相等的部分,並在循環中每次選取一個合併9個部分
df = pd.DataFrame(np.random.randn(10, 4), index=list(xrange(10)))
for x in range(3):
dfList = np.array_split(df, 3)
testdf = dfList[x]
dfList.remove(dfList[x])
print testdf
traindf = pd.concat(dfList)
print traindf
print "================================================"
爲什麼不scikit學習交叉驗證? http://scikit-learn.org/stable/modules/cross_validation.html#random-permutations-cross-validation-a-k-a-shuffle-split – 2015-04-02 03:12:02
我這樣做是作爲課程的一部分,並試圖實現驗證的任務。 – 2015-04-02 03:14:29