2014-02-12 55 views
10

我知道我需要平均值和S.D找到的間隔,但是,如果有什麼問題是:R中二項式數據的置信區間?

A survey of 1000 randomly chosen workers, 520 of them are female. Create a 95% confidence interval for the proportion of wokrers who are female based on survey.

如何找到平均值和S.D是什麼?

+0

也許看看這裏發佈的答案:http://stackoverflow.com/questions/17802320/r-proportion-confidence-interval-factor –

回答

16

您還可以使用prop.test從包stats,或binom.test

prop.test(x, n, conf.level=0.95, correct = FALSE) 

     1-sample proportions test without continuity correction 

data: x out of n, null probability 0.5 
X-squared = 1.6, df = 1, p-value = 0.2059 
alternative hypothesis: true p is not equal to 0.5 
95 percent confidence interval: 
0.4890177 0.5508292 
sample estimates: 
    p 
0.52 

您可能會發現有趣的this article,其中第861頁的表1中給出了不同的置信區間,對於單一比例,使用七種方法(針對n和r的選定組合)進行計算。使用prop.test你可以得到的結果行3和表4中,而binom.test回報你在第5行

+0

替代你的1.96's很好的答案,並且不需要任何外部軟件包。 – thelatemail

+0

@thelatemail這可能是一個愚蠢的問題,但是你如何利用95%的CI來將它變成SE然後是SD? – Alexander

12

在這種情況下,您有二項分佈,所以您將計算binomial proportion confidence interval

在R,你可以使用binconf()從包Hmisc

> binconf(x=520, n=1000) 
PointEst  Lower  Upper 
    0.52 0.4890177 0.5508292 

或者你也可以自己進行計算:

> p <- 520/1000 
> p + c(-qnorm(0.975),qnorm(0.975))*sqrt((1/1000)*p*(1-p)) 
[1] 0.4890345 0.5509655 
+5

你可以用'qnorm(0.975)' – thelatemail

9

或者看到,從prevalence包使用功能propCI,得到的五個最常用的二項式信心間隔:

> library(prevalence) 
> propCI(x = 520, n = 1000) 
    x n p  method level  lower  upper 
1 520 1000 0.52 agresti.coull 0.95 0.4890176 0.5508293 
2 520 1000 0.52   exact 0.95 0.4885149 0.5513671 
3 520 1000 0.52  jeffreys 0.95 0.4890147 0.5508698 
4 520 1000 0.52   wald 0.95 0.4890351 0.5509649 
5 520 1000 0.52  wilson 0.95 0.4890177 0.5508292 
1

另一個包:tolerance將計算信心/公差範圍爲一噸的典型的分佈函數。