2016-10-10 105 views
0

如何將數據集分爲原始數據集的75%和25%的訓練和測試集,分別使用分層採樣來保留這些新集中的比例類大小。我試圖用WEKA來做到這一點。WEKA中的分層採樣

「RemovePercentage」過濾器有助於不以分層方式進行,而「StratifiedRemoveFolds」過濾器不會使用百分比進行此操作。

我將不勝感激任何幫助或建議。

回答

0

因此,作爲解決方案,我使用stratifiedRemoveFolds將數據集分成兩部分。在這種情況下,我的摺疊次數是2,產生50%-50%的數據集。然後,我使用相同的方法將其中一個摺疊分成兩部分,產生原始數據集的25%-25%的子集。然後,我將25%的數據集中的一個合併到50%左右,產生75%-25%的分層分割 - 這是我的目標。