2016-02-12 73 views
0

我使用gbm(..., data = traindata, ...)訓練模型,並使用predict(... newdata = newdata, ...)進行預測。gbm中預測的輸入數據

我的問題:traindata和newdata需要有相同的格式(變量的順序和數量)?

在GBM說明書中,下列是爲預測()寫成:

如果對象是使用gbm.fit適合將沒有條款組件。 因此,用戶有更大的責任確保 新數據具有與最初用於擬合模型的 相同的格式(變量的順序和數量)。

這對gbm還是隻適用於gbm.fit? newdata可以有不同於traindata的格式嗎?

由於

回答

0

比方說你的數據具有的M個N(樣品和變量N個M個)的尺寸,如果是這樣,那麼您的預測集需要的K N表示接着樣品的數量是不重要,但變量的數量是。希望它有幫助

0

謝謝,但是預測集中的N個變量需要與訓練集(gbm)具有相同的順序嗎?

此外,與訓練集相比,預測集可以有額外的變量嗎?在預測中顯然應該忽略這些參數。

我的問題是gbm()和predict()是否識別變量的標籤。如果是這樣,則預測集中的變量和附加變量的順序應該對預測沒有影響。

謝謝

相關問題