2013-04-10 16 views
1

我有一個63 * 62的訓練集和類標籤也存在。測試數據是一個25 * 62的尺寸,也有類標籤。鑑於此,我將如何執行最小二乘迴歸?我使用的代碼:如何在R給定的訓練和測試數據與類標籤進行最小二乘迴歸?

res = lm(height~age)

是什麼身高和年齡對應?當我有61個特徵+ 1個類別(使訓練數據爲62列)時,我將如何輸入參數?

另外我該如何在測試數據上應用模型?

+0

你可以發佈'head(training.data)'嗎? – Nishanth 2013-04-10 01:49:33

回答

1

heightage只是數據框中列的標籤。 height是一個預測變量。你可以有任意多的變量,如你所願:res = lm(height~age+wight+gender)

但是,我必須說這個問題對我來說似乎有點奇怪,因爲如果你用62個變量在62個訓練集中執行迴歸,它只會意味着你將永遠有一個確切的解決方案。訓練集應始終(顯着)大於所用變量的數量。

2

如果你有62列您可能希望使用更通式

res = lm(height ~ . , data = mydata) 

注意如何時期「」代表其餘的變量。但以前的回答是完全正確的,因爲變量多於觀察值,因此答案(如果有的話不應該是)完全沒用。

+0

感謝您的回覆!現在我最適合使用:abline(res)。我將如何在測試數據上使用此模型? – user1403848 2013-04-10 00:41:09

+0

我不確定你的意思。 abline(res)應繪製一條最適合的線。這隻適用於我所知的兩個方面。 如果你想在。減去係數和乘以你可能想使用 coefs <測試數據 - 係數(RES) 但要小心,因爲第一個將攔截。 但是,如果嘗試以下操作,幾乎所有您想要進行基本回歸的顯示都會顯示: 摘要(res) – 2013-04-10 01:00:41

+0

對不起,但我試圖問是否可以使用使用培訓數據生成的模型在測試數據? – user1403848 2013-04-10 01:08:56

相關問題