4
我對R很新,所以請耐心等待。我使用卡方檢驗對核苷酸的頻率在給定的位置進行比較,並且我計數A,C,G,T的在兩個不同的數據集的數目:R樣本中的雙樣卡方檢驗
x1 <- c(272003,310418,201601,237168)
x2 <- c(239614,316515,182070,198025)
我可以想到兩種辦法要求兩樣本卡方檢驗:
> chisq.test(x1,x2)
Pearson's Chi-squared test
data: x1 and x2
X-squared = 12, df = 9, p-value = 0.2133
Warning message:
In chisq.test(x1, x2) : Chi-squared approximation may be incorrect
或
> chisq.test(cbind(x1,x2))
Pearson's Chi-squared test
data: cbind(x1, x2)
X-squared = 2942.065, df = 3, p-value < 2.2e-16
我懷疑是第二個版本是正確的,因爲我也可以這樣做:
> chisq.test(x1,x1)
Pearson's Chi-squared test
data: x1 and x1
X-squared = 12, df = 9, p-value = 0.2133
Warning message:
In chisq.test(x1, x1) : Chi-squared approximation may be incorrect
具有相同且明顯不正確的結果。
在這種情況下實際計算的是什麼?
謝謝!