我有一個數據集,包含來自A類的50%實例和B類的50%實例。我想將我的數據集分成一個訓練集和一個測試集。我知道RemovePercentage過濾器存在,但它不關心類平衡。我如何從我的數據集中刪除35%,但仍然保持訓練集中的50/50類分佈?如何從Weka中的數據集中刪除百分比但保持課程平衡?
0
A
回答
0
好吧,我發現使用過濾StratifiedRemoveFolds道:
步驟1
打開你的數據在Weka的瀏覽器設置,並選擇監督實例過濾StratifiedRemoveFolds。
步驟2
決定你想爲你的訓練和測試集的大小。如果您希望自己的尺寸相同,請選擇numFolds 2.應用過濾器。這將生成一個包含原始集合中50%數據的數據集。 (如果你想67個%列車數據和33%的測試數據然後挑選3 numFolds)
步驟3
保存此生成設定爲F.E. 「train.arff」。當第一組保存時,您必須撤消該操作,以便您返回完整的數據集。
步驟4
點擊StratifiedRemoveFolds過濾器,從錯誤更改參數invertSelection爲True。現在,當您應用該過濾器時,將會像第2步一樣生成一個集合,但它將包含另一個50%的數據集合。
步驟5
保存此爲「test.arff **。現在你有一列火車和測試集,尊重你的職業平衡。
0
看看Stratified刪除摺疊。它力求保持原始的類別分佈。 http://weka.sourceforge.net/doc.stable/weka/filters/supervised/instance/StratifiedRemoveFolds.html
相關問題
- 1. 從數據框中刪除百分比
- 2. 如何平衡剩餘的百分比?
- 3. 如何分類weka中的不平衡數據?
- 4. weka中的不平衡數據集?不起作用
- 5. 如何衡量百分比與數量?
- 6. 如何衡量百分比比聚集更大的畫面
- 7. 從數組中刪除一些百分比的元素
- 8. 保存到Android Pay:如何從Mechant中心刪除課程
- 9. 如何從數據集中刪除
- 10. 如何刪除小數點並在PieChart值中保留百分比?
- 11. MPAndroidChart PieChart刪除百分比
- 12. JavaFX:從ProgressIndicator刪除百分比
- 13. 刪除比數據幀第95百分更大的數據
- 14. 從MySQL表中的值中刪除百分比符號
- 15. 如何從Google Analytics自定義報告中刪除總數的百分比
- 16. 課程成績和百分比
- 17. Weka重新取樣以平衡二進制數據集中的實例
- 18. 如何在WEKA中設置參數以平衡SMOTE過濾器的數據?
- 19. 在大熊貓數據框中刪除行數據佔總數的百分比
- 20. 在百分比字段類型中刪除百分號
- 21. 如何根據百分比劃分數據集?
- 22. SSRS的百分比 - 兩個數據集
- 23. JS中的數學 - 如何從百分比中獲得比率
- 24. 刪除數據庫中的項目,但保持唯一ID
- 25. 如何在R中創建平衡訓練和不平衡測試數據集?
- 26. BIML中的平衡數據分銷商
- 27. 如何衡量代碼庫中的百分比差異?
- 28. 在weka中拆分數據集
- 29. 平均百分比
- 30. 如何刪除數據透視表頭,但保持功能
它可以生成採用分層刪除褶皺測試集但是這些實例並未從整個數據集中刪除,所以我的訓練集仍然包含測試集中的實例。 – Stanko