2017-08-14 102 views
2

使用標準化我很想知道的是,在R A H2O模型中使用標準化功能時攻入了新的數據時,它是如何工作的。當H2O新的數據

我知道,當它進行標準化的訓練集是基於均值和訓練數據的標準差設置均值爲0,標準差爲1,但又有什麼用新的數據呢?

是否規範基於訓練數據的平均值和標準偏差或者它規範基礎上,新的數據被拿下?

回答

0

的得分函數應用於用於訓練數據標準化至測試數據集相同的映射。這由H2O自動處理。

+0

感謝艾琳,這是我的猜測,否則係數不會像解釋。我想我只需要留意每個功能,這樣他們就不會有太多的加班。你也知道是否有函數會爲我抽取這些映射嗎?即均值和用來規範各功能還是我只寫一個函數,它是對原始數據...平均值(x)和SD(x)的標準偏差。基本上我想將模型更接近我的數據庫中的數據,並使用sql手動爲模型編寫函數。 –

+0

不,這些方法不會通過H2O客戶端API(我知道)公開。您可以關閉此功能並手動執行操作(請參閱GLM & DL;中的標準化參數,其他參數不會影響功能),但如果您要使用H2O進行建模,最容易讓H2O處理這自動。 –

+0

我後來發現h2o同時產生標準化係數和非標準化係數。非標準化的數據可以用於非標準化的數據! –