我急需幫助:因此,我使用dplyr按組運行迴歸。即是這樣的:關於級別數據的預測(使用組模型)
regressions <- mtcars %>% group_by(cyl) %>%
do(fit = lm(wt ~ mpg + qsec + gear, .))
,我得到的模型在數據幀,看起來像這樣:
## cyl fit
## (dbl) (chr)
## 1 4 <S3:lm>
## 2 6 <S3:lm>
## 3 8 <S3:lm>
現在我想預測對新的數據是短(也就是不一樣的漁政船爲我的培訓數據),並且具有相同的水平。 I.e 4,6,8 for cyl。我的問題是:我如何預測使用新/ testdata,以便每個模型僅在我的測試集中引用它們的級別。
so model cyl 4 only uses data 4 cyl to predict
model cyl 6 uses data 6 cyl to predict
model cyl 8 uses data 8 cyl to predict
and so on and so forth.enter code here
請記住測試數據包含其中的所有級別/組。
有沒有更簡單的方法來做到這一點。即按級別進行預測。目前我正試圖在掃帚包裝中使用增強功能,但它並不真正起作用。它所做的是:它通過我的所有測試數據運行每個模型,同時忽略該級別。
請幫忙!我正在以更大的規模進行此項工作,並且需要快速高效的工作。
非常感謝您的回覆。有沒有一種方法可以使用相同的邏輯運行,例如使用auto.arima函數的ARIMA模型或使用相同邏輯的holtwinters?即按照上面的方式分割數據集,運行一個holtwitters,然後返回一個預測,例如每個週期的x個週期。 –