2009-07-23 43 views
6

我正在使用一些相當直接的SQL代碼來使用最小二乘法計算某些(x,y)數據點的迴歸係數(截距和斜率)。這給我一個很好的通過數據的最佳擬合線。但是我們希望能夠看到最佳擬合線(下面的曲線)的95%和5%置信區間。SQL中的線性迴歸置信區間

link text http://www.curvefit.com/2a03be60.gif

什麼這些的意思是,該直線具有作爲上部曲線和存在下曲線在95%以上的概率低於95%的概率。我如何計算這些曲線?我已經閱讀了維基百科等,並做了一些谷歌搜索,但我還沒有找到可以理解的數學方程來計算這個。

編輯:這裏是我現在所擁有的精髓。

--sample data 
create table #lr (x real not null, y real not null) 
insert into #lr values (0,1) 
insert into #lr values (4,9) 
insert into #lr values (2,5) 
insert into #lr values (3,7) 

declare @slope real 
declare @intercept real 

--calculate slope and intercept 
select 
@slope = ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/ 
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)), 
@intercept = avg(y) - ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/ 
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)) * avg(x) 
from #lr 

在此先感謝您。

回答

0

@PowerUser:他需要使用方程兩變量設置,而不是一個變量的設置。馬特:如果我有我的舊統計教科書,我可以告訴你你想要什麼;不幸的是,我沒有和我在一起,我的高中統計課程也沒有我的筆記。另一方面,從我記得它可能只有東西的迴歸線的斜率的置信區間...

無論如何,這個頁面將希望有一些幫助:http://www.stat.yale.edu/Courses/1997-98/101/linregin.htm