2016-01-24 20 views
0

我有一個火車數據集(森林覆蓋類型)有10個連續變量,然後2個分類(40和4級)。所以在我看來,我的讀入圖層應該包含54個神經元(我正在使用1-C)。同樣,我發現另一個版本的數據(here),確實聲稱有54個屬性。H2O添加額外的神經元,以讀入

下面是我的模型的表示: enter image description here

的問題是,當我使用H2O中的R;它告訴我我有204,707個參數(第一層中有56個神經元)。我不明白爲什麼它打破(或如何)分類爲N + 1?我檢查並且沒有缺失值

回答

0

事實證明,H2O確實添加了一個(NA)類來處理缺失值(因此我們得到N + 1)。這有點奇怪,因爲我沒有。

+1

是的,H2O爲所有分類添加了一個NA類 - 這是因爲如果測試集包含一個新類別(不存在於訓練集中),那麼該值將有一定的位置。雖然這不是訓練所必需的,但如果您想要生產模型,這將有所幫助。 –