與預測（）函數的麻煩（可能容易解決）

2017-03-09 22 views 2 likes

這是我在本論壇中提出的第一個問題。我是個初學者，你們都會馬上告訴你。

我正在做一個小任務，我必須將訓練模型與測試模型進行比較。重點在於訓練模型比測試模型有更多的行。

通過線性迴歸模型，我想這兩種模式相比，但是當我使用的預測（）函數，我得到以下錯誤：

「newdata」有3456行，但變量發現最喜歡的7689行。

這是我做過什麼：

regression = lm(train$students~train$subjects, train)

（火車是trining數據庫）

prediction = predict(regression, test)

（測試是測試數據庫）

我不知道，如果I' m正確使用predict（）函數。有人能告訴我我做錯了什麼嗎？

非常感謝您的幫助和善意！

來源

2017-03-09 albert

嘗試添加'type ='response''作爲預測函數的參數。沒有一個可重複的例子，我無法幫助更多。 –

而不是嘗試 '迴歸= lm（學生〜科目，火車）預測=預測（迴歸，測試）' – G5W

非常感謝，G5W！ – albert

回答

不要在公式中將變量稱爲data$var。決不。永遠。

發生了什麼事情是您安裝了一個模型，其變量名爲train$students和train$subjects。根據模型預測，R將在測試集test中查找名爲train$subjects的變量。顯然在tests中不存在這樣的變量;誰會用這種愚蠢的名字創造變數！？在公式中不需要使用data$var格式，因爲data參數的整個點是指示R應該在公式中提及的變量的名稱。

要開始解決這個，適合模型爲：

regression <- lm(students ~ subjects, data = train)

然後使用

predict(regression, test)

預測，其中test需要有包含subjects列。

錯誤信息是因爲newdata有3456，但是當它搜索變量train$subjects它發現7689行，想必是完整的觀察中train數...？

來源

2017-03-09 22:03:24

它的工作原理。非常感謝，加文！ – albert

相關問題

11. 麻煩與解析關係
12. 麻煩解析與JArray.Parse Json
13. 麻煩與JSON-解析
14. DirectX不可預知的麻煩
15. 使用函數的麻煩
16. CORS麻煩無法解決jquery，laravel5.2
17. ofstream麻煩，我該如何解決？
18. C與數組的麻煩，
19. 麻煩與我的算法，解決了驚奇板
20. 麻煩與預壓spritekit紋理
21. 麻煩函數返回TRUE
22. 函數指針麻煩
23. Infinite Scroll + .on（）函數麻煩
24. 函數調用麻煩
25. Python容器麻煩
26. 麻煩與scala.util.parsing.combinator.ImplicitConversions
27. 麻煩與TableView
28. 麻煩與sapply
29. 麻煩與MATLAB
30. 麻煩與UICollectionViewCell