0
我已經分手了波士頓的數據集中到訓練和測試,如下設置:如何計算測試數據集中R的殘差標準誤差?
library(MASS)
smp_size <- floor(.7 * nrow(Boston))
set.seed(133)
train_boston <- sample(seq_len(nrow(Boston)), size = smp_size)
train_ind <- sample(seq_len(nrow(Boston)), size = smp_size)
train_boston <- Boston[train_ind, ]
test_boston <- Boston[-train_ind,]
nrow(train_boston)
# [1] 354
nrow(test_boston)
# [1] 152
現在我使用如下LM功能得到RSE:
train_boston.lm <- lm(lstat~medv, train_boston)
summary(train_boston.lm)
summary(train_boston.lm)$sigma
我如何計算剩餘標準誤差爲測試數據集?我無法在測試數據集上使用lm函數。有沒有任何方法可以計算測試數據集上的RSE?
的標準差我得到的RSE測試設定得比訓練集低?情況總是如此嗎? – elysefaulkner
否。測試集是完全獨立的。你可以做一個測試集來獲得你想要的任何RSE。這是因爲RSE在測試集中的含義並不像它在訓練集中那樣。 – MrFlick