2017-05-04 35 views
6

我想做一些數據分析,想法是使用autobinning命令創建最佳bin,計算每個bin的WOE(證據權重)值,然後替換原始值屬於具有相應WOE值的每個箱。所以下面是我做的:爲NaN值創建一個bin

CreSC = creditscorecard(Data_Table ,'IDVar','CustID','GoodLabel',0); 
scAB = autobinning(CreSC,'Algorithm','Monotone'); 
DataTransformed = bindata(scAB,t_Data,'OutputType','WOE'); 

的問題是,上述程序不考慮NaN值是在數據,並自動排除它們。

我的目標是僅爲NaN值創建單獨的容器,並強制autobinning命令考慮NaN值。

有沒有人有合理的解決方案?

回答

2

查找所有NaN值。

選取數據中不存在的值。

用這個值替換所有的NaN值。

運行你的分箱,最後你自己把這個值映射到NaN。

+0

謝謝你的回答。我已經嘗試過了。這種方式似乎不起作用,因爲分箱的間隔受到NaN上分配的值的影響。再次,我的目標是創建一個只有NaNs的垃圾箱! –