gbm中預測的輸入數據

我使用gbm(..., data = traindata, ...)訓練模型，並使用predict(... newdata = newdata, ...)進行預測。gbm中預測的輸入數據

我的問題：traindata和newdata需要有相同的格式（變量的順序和數量）？

在GBM說明書中，下列是爲預測（）寫成：

如果對象是使用gbm.fit適合將沒有條款組件。因此，用戶有更大的責任確保新數據具有與最初用於擬合模型的相同的格式（變量的順序和數量）。

這對gbm還是隻適用於gbm.fit？ newdata可以有不同於traindata的格式嗎？

由於

比方說你的數據具有的M個N（樣品和變量N個M個）的尺寸，如果是這樣，那麼您的預測集需要的K N表示接着樣品的數量是不重要，但變量的數量是。希望它有幫助

2016-02-12 17:08:33 nik

謝謝，但是預測集中的N個變量需要與訓練集（gbm）具有相同的順序嗎？

此外，與訓練集相比，預測集可以有額外的變量嗎？在預測中顯然應該忽略這些參數。

我的問題是gbm（）和predict（）是否識別變量的標籤。如果是這樣，則預測集中的變量和附加變量的順序應該對預測沒有影響。

謝謝

2016-02-13 19:38:40 TomDriftwood

回答