2012-02-24 83 views
0

我曾經看到用於計算置信區間基於樣本通常置信區間的用於計算置信區間

# set number of simulated data sets and sample size 
# mu is the mean for the normal 
    S <- 1000 
    n <- 15 
    mu <- 1 

覆蓋下述R函數R上實施的問題的意思是計算如下。這裏,sampmean.ses表示樣本平均值的標準誤差。我大都可以猜測這背後的邏輯。令我困惑的是R實現這個的方式,具體而言,outsampmean-t05*sampmean.ses <= mu打算做什麼?看起來總和是要計算滿足這兩個條件的所有離散點。

t05 <- qt(0.975,n-1) 
    coverage <- sum((outsampmean-t05*sampmean.ses <= mu) & 
     (outsampmean+t05*sampmean.ses >= mu))/S 
+2

你忘了在這個問題中包含一些代碼或其他信息嗎?我無法理解這一點。 – joran 2012-02-24 19:15:24

+2

它看起來像一個教學示例,顯示1000次置信區間中有多少次包含真實平均值,其中沒有顯示數據集的模擬和每個數據集的均值和平均值的計算。 – Aaron 2012-02-24 19:41:03

回答

2
S  <- 1000 
n  <- 15 
mu  <- 1  
sigma <- 50  
set.seed(1) 
matdat  <- matrix(rnorm(S*n, mean = mu, sd = sigma), nrow=S) 
outsampmean <- rowSums(matdat)/n 
sampmean.ses <- sqrt(rowSums((matdat-outsampmean)^2)/(n*(n-1))) 
t05   <- qt(0.975,n-1) 
coverage  <- sum((outsampmean-t05*sampmean.ses <= mu) & 
        (outsampmean+t05*sampmean.ses >= mu))/S 

會產生

> coverage 
[1] 0.946 

outsampmean-t05*sampmean.ses <= mu產生取決於TRUE或FALSE(有效地爲1或0中的總和)是否置信區間的從結果樣品計算出的下邊界均值和樣本均值標準誤差低於或高於總體均值。