2017-06-14 145 views
0

在訓練我的模型時,當我使用類似sklearn.model_selection.train_test_split(X, y, stratify=y, train_size=0.9)sklearn.model_selection.StratifiedKFold(n_splits=10)之類的東西時,我得到的結果截然不同,並且想知道他們如何對數據進行分層。我幾乎可以肯定,我根據文檔實現了一切,但奇怪的是,後者給出的測試精度比第一個差得多。StratifiedKFold與train_test_split分層之間的區別

+0

你能發佈一個我們可以嘗試和複製你的行爲的最小完整代碼嗎? –

回答

0

stratify不是無train_test_split在內部使用StratifiedShuffleSplit,而不是StratifiedKFold。所以是的,有很大的不同。

+0

@hyperdo此外,明顯的區別在於StratifiedKFold會給出10倍不同的列車和測試數據,而train_test_split只會給出一個。 –