2015-10-25 61 views
0

爲什麼h2o.randomforest計算出袋外樣本的MSE和訓練多郵件分類問題?h2o隨機森林計算多項分類問題的MSE

我已經做了二元分類也使用h2o.randomforest,那裏用來計算AUCout of bag sample同時training但對於多分類隨機森林是計算MSE這似乎可疑。請看這個截圖。

enter image description here

我的目標變量是含有4個因子水平model1model2model3model4的一個因素。在屏幕截圖中,您也會對這些因素產生混淆矩陣。

有人可以解釋這種行爲嗎?

回答

0

二項和多項分類均顯示MSE,因此您將在兩個模型(高亮顯示的training_MSE列)的「評分歷史記錄」表中看到它。

H2O不評估多項AUC。存在一些評估方法,但還沒有一種廣泛採用的方法。 pROC package討論手和Till的方法,但提到它不能被繪製和結果很少測試。對數分類特有的對數損失和分類錯誤仍然可用,因爲每個方法在多項環境下都有標準的評估方法。

如您突出顯示的那樣,您有一個混淆矩陣來比較您的4個因子水平。你能澄清你還有什麼期望嗎?如果您正在查找四個單獨的混淆矩陣,那麼四列表格包含足夠的信息以供計算。