1
在具有「ignore_const_cols」參數的h2o模型中,如何針對缺失值確定「常量」?ignore_const_cols缺失值
即,如果一列只有一個唯一的非缺失值和一些缺失值,並且選擇了「ignore_const_cols」,那麼在該列上將不會出現分裂以將缺失值與一個常量值分開?
在具有「ignore_const_cols」參數的h2o模型中,如何針對缺失值確定「常量」?ignore_const_cols缺失值
即,如果一列只有一個唯一的非缺失值和一些缺失值,並且選擇了「ignore_const_cols」,那麼在該列上將不會出現分裂以將缺失值與一個常量值分開?
這是很容易測試這個
R代碼裏面:
library(h2o)
h2o.init()
iris_data<-as.data.frame(iris)
iris_data$Petal.Width<-1
iris_data[iris_data$Species=='setosa','Petal.Width']<-NA
iris_h2o<-as.h2o(iris_data)
h2o.gbm(training_frame=iris_h2o,y='Species')
iris_data$Petal.Width<-as.factor(iris_data$Petal.Width)
iris_h2o<-as.h2o(iris_data)
h2o.gbm(training_frame=iris_h2o,y='Species')
無論是否有缺失值常數列是數字或因素,給出了同樣的警告:
Warning message:
In .h2o.startModelJob(algo, params, h2oRestApiVersion) :
Dropping constant columns: [Petal.Width].
因此,您的問題的答案似乎是,當確定列是否爲常數時,h2o忽略缺失值