2015-10-13 76 views
0

在下面的代碼,做我需要按照方法1或方法2 我很困惑,爲什麼在要使用的測試數據預測,因爲每個方法1。 如果有人能夠詳細解釋它會很棒。爲什麼預測()中的R,必須對測試數據進行

train <- sample(nrow(sales), nrow(sales)*0.6) 
test <- sales[-train] 

方法1

fit <- lm(y~x,data=train) 
predict(fit,data=test) 

相反,我不能做到這一點的方法:
方法2

fit <- lm(y~x,data=train) 
predict(fit,data=train) 

fit1 <- lm(y~x,data=test) 
predict(fit1,data=test) 
+0

有什麼錯誤/輸出? –

+0

我沒有收到任何錯誤?只是想知道哪種方法更好,爲什麼更好 – user3493414

回答

0

使用訓練的訓練數據的模型一般來說,predict(),適用於訓練數據,只能用於對訓練後的模型進行反思。將它應用於(理想的獨立的)測試數據可以作爲驗證訓練模型或使用模型進行進一步預測。

換句話說,他們不是不同的方法做同一件事;他們完成完全不同的事情。

相關問題