2013-12-13 34 views
3

wls_prediction_std返回我擬合的模型數據的標準差和置信區間。我需要知道從協方差矩陣計算置信區間的方式。 (我已經試圖通過查看源代碼來弄清楚,但無法做到)我希望你們中的一些人能夠通過寫出wls_prediction_std後面的數學表達式來幫助我。statsmodels的數學背景wls_prediction_std

回答

7

在任何教科書中都應該有一個變體,沒有重量。

對於OLS,格林(第5版,我使用的)具有

se = s^2 (1 + x (X'X)^{-1} x')

其中s^2的剩餘方差的估計,x是一個我們要預測矢量或解釋變量和X是估計中使用的解釋變量。

這是觀察的標準誤差,單獨的第二部分是預測的平均值的標準誤差y_predicted = x beta_estimated

wls_prediction_std直接使用參數估計的方差。

假定x爲固定的,那麼y_predicted僅僅是隨機變量beta_estimated的線性變換,所以y_predicted方差只是

x Cov(beta_estimated) x'

爲了這一點,我們仍然需要添加誤差的估計值方差。

據我所知,有估計有更好的小樣本屬性。

我添加了權重,但從來沒有設法驗證它們,所以函數一直保留在沙箱中多年。 (塔塔不與權重返回預測誤差。)

旁白:

使用的參數估計的協方差也應該是正確的,如果我們用一個三明治強大的協方差估計,而高於格林公式是,如果唯一正確的我們沒有任何錯誤的異方差。

wls_prediction_std沒有考慮到的是,如果我們有一個異方差性模型,那麼誤差方差也可能取決於解釋變量,即x。