chisq.test錯誤消息

這裏是我現在遇到了一個問題：chisq.test錯誤消息

示例數據

df <- data.frame(1,2,3,4,5,6,7,8) 
df <- rbind(df,df,df,df)

我想什麼做的是找到適合的1,2 chisq.test的p.value ，在第一行中定義的data.frame中的3與4,5,6。

讓我們試一下全力以赴：

chisq.test(c(1,2,3),c(4,5,6))$p.value ## this works.

但是當我嘗試通過調用列/行做...

chisq.test(df[1,1:3],df[1,4:6])$p.value

給出：錯誤complete.cases（X， Y）：不是所有的參數都相同的長度

有趣的，因爲這似乎並不爲真：

length(df[1,1:3]) 
length(df[1,4:6])

有關如何更改記號以獲得所需結果的想法？

來源

2011-01-19 Brandon Bertelsen

我的預感，是它與姓名有關，但如果是這樣的話，錯誤信息並不是很有啓發性。 – 2011-01-19 20:21:06

?chisq.test告訴我們：

Arguments: 

     x: a numeric vector or matrix. ‘x’ and ‘y’ can also both be 
      factors. 

     y: a numeric vector; ignored if ‘x’ is a matrix. If ‘x’ is a 
      factor, ‘y’ should be a factor of the same length.

如果我們看一下df按你的Q，你定義的子集是：

> is.numeric(df[1,1:3]) 
[1] FALSE 
> is.vector(df[1,1:3]) 
[1] FALSE 
> is.matrix(df[1,1:3]) 
[1] FALSE

和你的其他相同子集。然後發生在上帝的一圈。什麼在內部發生的是，作爲df[1,1:3]是一個數據幀，它首先被轉換到一列矩陣，並從那裏到向量：

Browse[2]> x ## here x is df[1,1:3] 
[1] 1 2 3

而df[1,4:6]（y在chisq.test函數）保持不變：

Browse[2]> y 
    X4 X5 X6 
1 4 5 6

當代碼調用complete.cases(x,y)，我們得到的錯誤你彙報：

Browse[2]> complete.cases(x, y) 
Error in complete.cases(x, y) : not all arguments have the same length

complete.cases調用內部代碼，所以我們不能看到發生了什麼，但本質上R認爲x和y長度不一樣，這是因爲它們是不同的類型。

@Prasad提供瞭解決方法，即將您提供給chisq.test的2個數據幀取消列入向量。

但是，至少對我來說，使用這個函數的方式並沒有什麼意義。通常將數據存儲在列中，而不是數據框的行。它可能看起來沒有區別，但數據框的列是其組件，就像列表的組件一樣。每個單獨的組件（列）都是一個離散實體，是數據框中/ n /個觀測數據的一個向量。如果我們調換您df（投下回的數據幀），以反映更自然的數據設置：

> df2 <- data.frame(t(df))

那麼我們就可以用你做的方法，但指數的第一列的不同的行df2（而不是df第一排的單獨的列）在chisq.test呼叫：

> chisq.test(df2[1:3,1], df2[4:6,1]) 

    Pearson's Chi-squared test 

data: df2[1:3, 1] and df2[4:6, 1] 
X-squared = 6, df = 4, p-value = 0.1991 

Warning message: 
In chisq.test(df2[1:3, 1], df2[4:6, 1]) : 
    Chi-squared approximation may be incorrect

這工作，因爲R是能夠丟棄空的尺寸在兩個子集，所以兩個輸入都是合適的載體長度：

> df2[1:3,1] ## drops the empty dimension! 
[1] 1 2 3 
> is.vector(df2[1:3,1]) 
[1] TRUE

來源

2011-01-19 23:09:47

感謝您的詳細信息。有趣的是，當我嘗試強制時，is.vector（as.vector（df [1,1：3]））也返回false，沒有錯誤。 – 2011-01-20 01:47:20

使用unlist當你提取從數據幀中的行：

> chisq.test(unlist(df[1,1:3]),unlist(df[1,4:6]))$p.value 
[1] 0.1991483 
Warning message: 
In chisq.test(unlist(df[1, 1:3]), unlist(df[1, 4:6])) : 
    Chi-squared approximation may be incorrect

來源

2011-01-19 20:21:29

以防萬一有人看過這個。正確的chisq代碼用於測試同一行中的分發包使用rbind（unlist（df [1，1：3]），unlist（df [1,4：6]）） – 2011-01-20 01:49:09

chisq.test錯誤消息

回答

相關問題