我有一個數據幀,看起來像這樣的:解讀黃土迴歸的置信區間
days <- c(1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,6,6,6,6,6,6,7,7,7,7,7,7)
values <- c(3,4,5,6,7,8,1,4,5,9,9,10,3,4,7,7,7,10,4,6,6,8,9,9,1,1,2,3,3,6,2,2,3,5,6,6,6,7,7,8,9,9)
df <- data.frame(days,values)
爲了確定我的數據的信號,我決定申請一個簡單的loess
平滑:
loess <- loess(df$values~df$days, span=1)
pred <- predict(loess, loess$x, se=TRUE)
plot(days,values)
lines(loess$x, loess$fitted, col="red", lwd=1.5)
lines(loess$x,pred$fit - qt(0.975,pred$df)*pred$se, lty="dashed", col="blue", lwd=1)
lines(loess$x,pred$fit + qt(0.975,pred$df)*pred$se, lty="dashed", col="blue", lwd=1)
結果,包括置信區間,看起來是這樣的:
我看到的是,例如,3天第5天的價值較高,但這種差異是否顯着?我應該比較每天的置信區間(在這種情況下是重疊的),還是應該將我的解釋基於黃土曲線與CI(例如在第3天,曲線超出第5天的置信區間)?