相當數量的問題,我今天做了。計算兩個數據集的置信區間
我想計算置信區間(99%的水平,而不是95)爲可變兩歲dataframes,infert_control
和infert_patient
的平均值,其中:
infert_control = subset(infert$age, infert$case == 0)
infert_patient = subset(infert$age, infert$case == 1)
infert
是一個內置的R數據集,對於那些不熟悉它的人,這裏是:病例0命名爲對照組患者,病例1實際的。
> infert
education age parity induced case spontaneous stratum pooled.stratum
1 0-5yrs 26 6 1 1 2 1 3
2 0-5yrs 42 1 1 1 0 2 1
3 0-5yrs 39 6 2 1 0 3 4
4 0-5yrs 34 4 2 1 0 4 2
5 6-11yrs 35 3 1 1 1 5 32
6 6-11yrs 36 4 2 1 1 6 36
7 6-11yrs 23 1 0 1 0 7 6
8 6-11yrs 32 2 0 1 0 8 22
9 6-11yrs 21 1 0 1 1 9 5
10 6-11yrs 28 2 0 1 0 10 19
11 6-11yrs 29 2 1 1 0 11 20
...
239 12+ yrs 38 6 0 0 2 74 63
240 12+ yrs 26 2 1 0 1 75 49
241 12+ yrs 31 1 1 0 0 76 45
242 12+ yrs 31 2 0 0 1 77 53
243 12+ yrs 25 1 0 0 1 78 41
244 12+ yrs 31 1 0 0 1 79 45
245 12+ yrs 34 1 0 0 0 80 47
246 12+ yrs 35 2 2 0 0 81 54
247 12+ yrs 29 1 0 0 1 82 43
248 12+ yrs 23 1 0 0 1 83 40
什麼是解決此問題的正確方法?
我已經計算age
列的兩個infert_control
和infert_patient
,加上每個子集的標準偏差的平均值。
這是一個統計問題。但你可以報告正確的'分位數' – rawr
也許't.test'可以幫到你嗎? – Fernando
@Fernando由於本練習的第二部分需要't.test()',所以我認爲我不應該在這部分中使用它,這是第一部分。這整個事情是一個介紹到R的任務。 –