2017-05-18 80 views
-2

我有房子的幾個特徵,包括類型,位置,臥室的數量等。例如一個數據集的價格區間:預測房屋

  • 類型:公寓,半獨立屋,獨立屋房子
  • 地點:(緯度,經度)等雙(40.7128°N,74.0059°W)
  • 臥室數量:1,2,3,4 ...

目標變量I想預測是房價。然而,在原始數據集給出的房子價格是價格,而不是數值的區間,例如:

  • 房價:0,100000),[100000,150000),[150000,200000), [200000,250000)等

所以我的問題是我應該使用什麼模型,如果我想預測房價的範圍?簡單的迴歸模型似乎不起作用,因爲我們預測的是區間而不是連續的數值。

在此先感謝。

回答

1

我會使用價格範圍的中位數並運行線性迴歸。在你的情況下,標籤將是{50000,125000,175000,225000,...}。在獲得預測價格後,只需選擇它所屬的範圍即可。

或者,如果價格範圍是固定的,您可以使用一對一邏輯迴歸,但我確信這不是最好的方法。