2017-08-28 58 views
0

我從訓練數據集中得到R中的所得迴歸係數。我現在想要使用它們並將它們應用於另一個數據集來預測值,但是某些X /獨立變量有N/A或缺失值,這也導致預測值爲N/A。我可以使用哪些命令,這樣即使某些因變量信息丟失,predict()命令仍會預測該行的值?即使在R中的迴歸變量缺失值時也能預測

+0

'預測'正在根據您的建模函數(例如,「lm」,「glm」等)生成的迴歸方程生成預測。那個方程式就像'y = 0.1 * x1 + 3.26 * x2 - 0.048 * x3 + ...'。如果你的其他數據集有一個觀察值(一行)缺少一個值,例如'x3',那麼就沒有辦法爲這個觀測值預測'y',因爲沒有什麼值可以插入' x3'。爲了得到預測結果,您可以(1)將其他數據集中的缺失值計算出來,或者(2)僅使用其他數據集中存在的變量來訓練模型。 – eipi10

+1

您可以使用'鼠標'軟件包。這個軟件包和函數'mice()'可以用來推測缺失的值 –

回答

2

您需要處理缺失的值。根據您處理的數據類型,您可能會相應地忽略缺失值。例如。 - 如果列的數據類型爲int,則可以嘗試用平均值或中值替換它們。如果你可以對你處理的數據更具體,它將提供更多的清晰度。