2013-11-22 18 views
1

我想我需要一些R特定的統計幫助。 以下是我的「實驗設計表」。 我想測試在FamilyF vs all和FamilyG與所有條件的條件下,「分數」的分佈在類型X與type_norm的基因中是否不同。kruskal測試行和列作爲因素

這裏是我的「實驗設計」:

FamilyF FamilyF FamilyG FamilyG 
gene_type gene conditionA conditionB conditionC conditionD 
typeX gene1 1 2 3 4 
typeX gene2 0.1 0.2 0.3 0.4 
typeX gene3 -1 -2 -3 -4 
norm gene4 10 20 30 40 
norm gene5 1 2 3 4 
norm gene6 0.1 0.2 0.3 0.4 

我有差異,分佈在不同條件下的基因之間只是測試,使用類似於秩測試和一些之前沒有前面的分析。

將數據重新排列,以這樣的:

gene gene1 gene2 gene3 gene4 gene5 gene6 Family 
conditionA 1 0.1 -1 10 1 0.1 F 
conditionB 2 0.2 -2 20 2 0.2 F 
conditionC 3 0.3 -3 30 3 0.3 G 
conditionD 4 0.4 -4 40 4 0.4 G 

然後我爲列的循環基因1-gene6,以及爲具體條件不同元數據列,並進行採用Kruskal測試,如下。

kt<-kruskal.test(df.plsMD[,"gene1"]~df.plsMD[,"Family"]) 

但我不知道如何執行類似的行和列作爲因素。

任何幫助,將不勝感激。

謝謝

回答

0

如果我理解正確的話,你可以這樣做,在一個分析。您是預示了於子集的數據幀的不同基因是這樣的:

df.gene1 <- subset(df, gene = "gene1") 
df.gene2 <- subset(df, gene = "gene2") 
.... 

之後,你可以使用克魯斯卡測試:

kruskal.test(conditionA ~ gene_type, data = df.gene1) 

如果這給出了一個顯著的結果,你可以檢查在發生差異:

df.gene1$Ranks.gene_type <- rank(sophdata$conditionA) 
by(df.gene1$Ranks.gene_type, df.gene1$gene_type, mean) 
kruskalmc(conditionA ~ gene_type, data = df.gene1)