2015-10-15 24 views
0

中控制CutPoints(執行受監督裝倉時)我正在使用R的「離散化」包。找到割點時,我得到以下結果。如何在R

命令:

discretization::cutPoints(data3$Dist_to_Stream, data3$Malaria_w3) 

其中Dist_to_Stream是數值和Malaria_w3的變量是類(分類)

[1] 5.118175 95.484400 119.386500 300.842000 311.320500 
[6] 338.104000 387.722500 460.783000 472.821500 551.741500 
[11] 910.745500 214.143000 234.124500 260.812000 358.513000 
[16] 361.015500 449.447500 538.411500 589.118500 626.888000 
[21] 657.261000 648.304500 698.310500 953.814500 1091.265000 
[26] 1181.350000 2023.885000 2040.360000 2069.390000 2201.395000 
[31] 2120.185000 2142.255000 2456.820000 2819.860000 

輸出分割點太多(34個二進制位)。有監督(基於熵)分檔時,有沒有辦法控制分割點的數量?

由於提前..

回答

0

discretization包的R的功能不提供任何這樣的參數來控制箱(Discretization Documentation)的數目。這可以通過SPSS的Optimal Binning選項輕鬆完成。在執行分箱之前,可以設置箱的最大數量(仍然是監督分箱)。

欲瞭解更多信息 Optimal Binning