3
從文檔:caret包中的createDataPartition函數如何拆分數據?
對於自舉樣本,使用簡單隨機採樣。
對於其他數據拆分,當y是試圖平衡拆分中的類分佈的因素時,隨機抽樣在y 的級別內完成。
對於數字y,根據百分位 將樣本分成組,並在這些子組內對樣本進行抽樣。
對於createDataPartition,通過組 參數設置百分位數。
我不明白爲什麼需要這個「平衡」的東西。我想我表面上理解它,但是任何額外的見解都會非常有幫助。