1

我有一個預測房價的現有模型,它使用簡單線性迴歸。作爲輸入,我有日期和輸出是價格。簡單線性迴歸比多變量/多重法更好的結果

我想改善整體效果,所以我增加了一個功能。新功能是距估計房產的距離。

問題是多元/多元迴歸比簡單迴歸表現得差一些。 (所有的數據都被標準化)

你有一些想法,爲什麼會發生這種情況,我該如何解決這個問題?

回答

1

有幾十個可能的原因,只是列出幾個:

  • ,如果你的新功能是勉強你想預測什麼相關性 - 你有效地將噪聲注入到系統中,因此不能期待更好性能
  • ,如果你有很少的數據點,因爲您使用的線性模型更多的功能會導致更難的問題
  • ,即使新功能是非常好的預測,但其關係不是線性從屬變量 - 模型將會失敗一報還一
  • 線性迴歸,因此是非常幼稚的模型,甚至嶺/套索迴歸可能會徹底改變的結果(特別是套索,因爲它與壞的特徵涉及更好)