2017-08-26 62 views
0

我想問一個多參數線性迴歸模型。 問題是如下: 我們現在100家公司的數據,併爲每家公司,我對參數A的數據,B,C,d爲3個賽季(我們可以把它叫做A1,A2,A3,B1 ,B2,B3 ..等) 我們假設A和BCD之間存在某種關係(我們還不知道,需要找到),現在我們需要預測A的第4季,即A4 ...如何在Python中構建多參數線性迴歸

我的方法是計算使用普通最小二乘式的關係,並在形式A4 = X1得到一個最終的公式* B4 + X2 * C4 + X3 * D4。 我得到B4,C4,D4通過簡單做B,C,D的線性迴歸 但問題是我得到的A4比只是做線性迴歸A ...

有人可以告訴我是一個更好的解決方案? 感謝

回答

0

我也是用於數據分析和建模的一支新秀。 如果我遇到這種問題,我可能會考慮像一些問題:

  • 是否有真的一個顯著的線性或自變量和因變量之間的廣義線性關係?我應該在迴歸之前預處理或轉移它們嗎?
  • 是否需要涉及預測變量之間的交互?
  • 用於訓練模型的數據集的質量如何?無論是之間的真正的基本關係因素迴應不夠好
  • 我應該選擇一種更合適的方法來創建預測模型嗎?例如,除了普通最小二乘迴歸(OLS)之外,我們通常選擇偏最小二乘迴歸(PLS)來解決我工作領域的多重共線性問題。

    希望這些能對你有所幫助。

+0

感謝您的答覆。我徘徊在那裏存在關係或不存在。也許嘗試使用PLS或更好的數據集可以幫助我找出答案。 –

+0

是的,另一件事是「線性迴歸不是哲學家的石頭」,您可能需要其他工具來建立模型。 – SpinoPi