2016-02-29 112 views
0

在我的統計分析中,我比較了樣本在給定答案(Y/N)時是否有可能回答(Y/N)對問題1R,比較兩個2x2矩陣/表之間差異的顯着性

millenials_q1q2 <- matrix(c(25, 150, 100, 25),ncol=2, byrow=FALSE) 
babyboomers_q1q2 <- matrix(c(100,75,60,60),ncol=2, byrow=FALSE) 

我已經能夠使用proptable以圖表的行和列百分比:

prop.table(test_data1, 1) 
prop.table(test_data1, 2) 

prop.table(test_data2, 1) 
prop.table(test_data2, 2) 

什麼我希望做的是直接比較兩個矩陣評估這兩種模式之間的差異的意義。

我希望這是有道理的,並提供足夠的背景!

EDIT(更多情況下):

我已經受人口subsettted數據集(即Y世代,嬰兒潮一代),我有興趣探索,如果/這些子樣本如何回答Q1和Q2不同。

上面的矩陣代表了他們如何回答問題的截然不同,我對測量這種差異很感興趣。 (相比,比方說,下面的矩陣是相似的)

millenials_same <- matrix(c(55, 45, 55, 45),ncol=2, byrow=FALSE) 
babyboomers_same <- matrix(c(57, 44, 53, 46),ncol=2, byrow=FALSE) 

這是否有助於澄清我的問題?謝謝!

+0

它具有一定的意義,但它對於編碼太模糊,並且確實沒有「上下文」。詢問的範圍是什麼?你打算應用什麼措施來「比較」兩個矩陣? –

+0

感謝您的回覆。我已經編輯了上述問題,希望能夠澄清我的困惑。 – ejgennri

回答

0

假設這些矩陣具有配對數據,您可以根據每對差異構造一個置信區間。

  1. 創建矩陣 「d」 與值TEST_DATA1-TEST_DATA2(的 「d」 第一項是TEST_DATA1 [1] -test_data2 [1])
  2. 構建對值的「d的平均值的置信區間「在第2步

更多細節可以看這裏:http://www.cyclismo.org/tutorial/R/confidence.html

如果置信區間不包括‘0’,你可以說,沒有證據說,在該值的差是微不足道的。