2017-05-17 27 views
1

我有以下data.table使用h2o進行多項式迴歸的部分依賴關係圖

fixed acidity volatile acidity citric acid residual sugar chlorides free sulfur dioxide total sulfur dioxide density pH 
    1:   7.0    0.27  0.36   20.7  0.045     45     170 1.00100 3.00 
    2:   6.3    0.30  0.34   1.6  0.049     14     132 0.99400 3.30 
    3:   8.1    0.28  0.40   6.9  0.050     30     97 0.99510 3.26 
    4:   7.2    0.23  0.32   8.5  0.058     47     186 0.99560 3.19 
    5:   7.2    0.23  0.32   8.5  0.058     47     186 0.99560 3.19 

sulphates alcohol quality 
    1:  0.45  8.8 Bad wine 
    2:  0.49  9.5 Bad wine 
    3:  0.44 10.1 Bad wine 
    4:  0.40  9.9 Bad wine 
    5:  0.40  9.9 Bad wine 

我可以運行

system.time(model_glm <- h2o.glm(x = 1:11, y = 12, training_frame = wine.train.h2o, 
           validation_frame = wine.test.h2o, seed = 42, 
           family = "binomial")) 

訓練對這個數據集的GLM。後來爲了得到部分依賴情節,我可以使用

glm_pp <- rbindlist(lapply(glm_pp, function(x){melt(x, id.vars="mean_response")})) 
ggplot(glm_pp, aes(x=value, y=mean_response)) + geom_point() + facet_wrap(~variable, scale="free_x") + 
    geom_smooth(method="loess") + theme_pl() + ggtitle("Partial dependence plot") 

在我的情況我yquality,這是一個binary variable

如果我的dependent variable有3個或更多的類別,我怎麼能得到偏依賴關係圖,所以如果我使用family = multinomial來運行glm?

回答

1

當前,H2O在其部分依賴項實現中支持二項和迴歸模型。多項模型尚不兼容。

-Nav