我正在嘗試使用R來運行學生t檢驗和卡方檢驗與大型數據集。由於我對R相當陌生,因此我的經驗不足使我在自己的代碼中取得了很大的成功。循環學生T檢驗和Chi-Squared中缺失數據R
兩組數據有丟失的數據,並期待這樣的:
AA assayX activity assayY1 activity assayY2 activity
chemical 1 TRUE 0 12.2
chemical 2 TRUE 0
chemical 3 45.2 35.6
chemical 4 FALSE 0 0
AB assayX activity assayY1 activity assayY2 activity
chemical 1 TRUE FALSE TRUE
chemical 2 TRUE FALSE
chemical 3 TRUE TRUE
chemical 4 FALSE FALSE FALSE
既然是我想創建一個代碼,我可以比較assayX所有assayYs大型數據集。我希望爲第一個數據集創建一個學生t檢驗循環,併爲卡方循環創建第二個數據集。我以前曾經成功地爲相關性分析創建了一個循環代碼,所以我根據這個想法創建了我的代碼。
x<- na.omit(mydata1[, c(assayX)])
y<- na.omit(mydata1[, c(assayY1:assayYend)])
lapply(y, function(x)t.test(y~x))
x<-na.omit(mydata2[, c(assayX)])
y<- na.omit(mydata2[, c(assayY1:assayYend)]
lapply(y, x=x, chisq.test)
問題與第一個代碼是: 無效變量y
問題與第二代碼: x和y必須具有相同的長度
我已經在這裏做了小的調整和在那裏,並且剛剛得到不同類型的錯誤,例如不夠「y」觀察等等。我一直主要使用這個網站來弄清楚R是如何工作的,所以我希望你們能爲新人提供一個聰明的小解決方案。
感謝您的答覆。對於卡方檢驗,我得到一個錯誤,說明x和y的值必須是相同的長度,並且t檢驗的可變長度也會有差異。無論如何圍繞它? – ephackett
我認爲問題在於如何構建數據集並將其發送到假設檢驗。我將用測試數據集進行更新。 –