2016-06-23 30 views
1

我有一個數據幀,看起來像這樣的:解讀黃土迴歸的置信區間

days <- c(1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,6,6,6,6,6,6,7,7,7,7,7,7) 
values <- c(3,4,5,6,7,8,1,4,5,9,9,10,3,4,7,7,7,10,4,6,6,8,9,9,1,1,2,3,3,6,2,2,3,5,6,6,6,7,7,8,9,9) 

df <- data.frame(days,values) 

爲了確定我的數據的信號,我決定申請一個簡單的loess平滑:

loess <- loess(df$values~df$days, span=1) 
pred <- predict(loess, loess$x, se=TRUE) 

plot(days,values) 

lines(loess$x, loess$fitted, col="red", lwd=1.5) 

lines(loess$x,pred$fit - qt(0.975,pred$df)*pred$se, lty="dashed", col="blue", lwd=1) 
lines(loess$x,pred$fit + qt(0.975,pred$df)*pred$se, lty="dashed", col="blue", lwd=1) 

結果,包括置信區間,看起來是這樣的: df_loess_95ci

我看到的是,例如,3天第5天的價值較高,但這種差異是否顯着?我應該比較每天的置信區間(在這種情況下是重疊的),還是應該將我的解釋基於黃土曲線與CI(例如在第3天,曲線超出第5天的置信區間)?

回答

2

您誤解了這裏的置信區間。對於類型的迴歸問題:

observations = signal + noise 

我們往往會產生逐點置信區間爲估計的信號。這種約定包括線性模型,廣義線性模型,非參數迴歸等。

逐點置信區間很容易計算,並幫助您評估每個點的估計變量如何,但無法進行交叉比較。在你的情況下,每一天的點明智置信區間有重疊並不意味着它們之間沒有統計學差異。

如果你真的想測試是否有來自不同天觀測值之間顯著差異,例如,第3日和第5天測試是否有顯著差異,你應該做t檢驗:

day3 <- df$values[df$days == 3] 
day5 <- df$values[df$days == 5] 
## test whether two group have the same mean, i.e., mean difference = 0 
t.test(day3, day5, mu = 0)$p.value 
## 0.0177 

現在,你可以看出,第5天和第3天在0.05的顯着性水平上在統計學上是不同的。

一般來說,你應該做的配對t檢驗

pairwise.t.test(df$values, df$days, p.adjust.method = "none", pool.sd = FALSE) 

# Pairwise comparisons using t tests with non-pooled SD 

# data: df$values and df$days 

# 1  2  3  4  5  6  
# 2 0.62614 -  -  -  -  -  
# 3 0.52954 1.00000 -  -  -  -  
# 4 0.20951 0.69979 0.62189 -  -  -  
# 5 0.02519 0.05772 0.01775 0.00307 -  -  
# 6 0.19799 0.19597 0.10104 0.02372 0.24736 -  
# 7 0.04247 0.41763 0.27750 0.50416 0.00044 0.00355 

# P value adjustment method: none 

注意使用pairwist.t.test這裏:通過設置pool.sd = FALSE

  • ,沒有共同的標準誤差估計所有羣體;
  • 通過設置p.adjust.method = "none",未調整t.test返回的原始p值。

通過這種方式,您可以看到(5,3)的p值與我們以前的t檢驗中看到的值相符。

您的數據已綁定值,以便您有幸運。對於實時系列,每天都沒有重複;在這種情況下,你沒有配對t檢驗。

0

我認爲這個問題可能更適合於https://stats.stackexchange.com/

要回答你的問題,雖然,你要對獨聯體比較,你會如果你沒有在一個時間序列比較兩個估計。

NB重疊CI並不一定意味着沒有顯着差異。