2012-09-24 233 views
-1

我需要一些數據分析幫助。
我確實有兩個數據集(之前的&之前),我想看看它們之間的差異有多大。比較多個數據幀

之前

11330 STAT1 
2721 STAT2 
52438 STAT3 
6124 SUZY 

17401 STAT1 
3462 STAT2 
0 STAT3 
72 SUZY 

試圖給他們組tapply(before$V1, before$V2, FUN=mean)
但是,當我試圖繪製它,在x軸上沒有得到組名稱,而是數字。 如何繪製這樣的數據(Y軸上的頻率&組名在X軸上)?

也想問一下,在R中比較這樣的數據集是什麼是正確的命令,我願意找到它們之間的區別?


被修改

dput(前$ V1)
C(11330L,2721L,52438L,6124L)

dput($ V2之前)
結構(1: 4,.Label = c(「STAT1」,「STAT2」,「STAT3」,「SUZY」),class =「factor」)

+0

如何通過將組名稱放在x軸上來比較這些數據集?每個值有兩個值。 –

+1

我很願意通過目測看到兩塊地塊之間的區別,但我明白,有更好的做法。 – PoGibas

+0

這是什麼樣的「數據集」?我從數據配對的名稱(STAT1 in before匹配STAT1 in after?)之後可以使用'dput(before1)'和'dput(before2)'發佈'before1'和'before2'數據集的樣本嗎? –

回答

5

這裏有幾個想法。

這是我的認爲你的數據看起來像什麼?

before <- data.frame(val=c(11330,2721,52438,6124), 
        lab=c("STAT1","STAT2","STAT3","SUZY")) 
after <- data.frame(val=c(17401,3462,0,72), 
        lab=c("STAT1","STAT2","STAT3","SUZY")) 

它們合併成單個數據幀與period變量:

combined <- rbind(data.frame(before,period="before"), 
     data.frame(after,period="after")) 

重新格式化爲一個矩陣和繪圖與(鹼R)dotchart

library(reshape2) 
m <- acast(combined,lab~period,value.var="val") 
dotchart(m) 

劇情與ggplot

library(ggplot2) 
qplot(lab,val,colour=period,data=combined) 
+1

感謝您的幫助!它解決了我的繪圖問題,但我也想問一下,如果可以將這兩組數據分開(之前/之後),以便至少獲得多少次相互之間的差異。 – PoGibas

+0

你的意思是計算它們之間的差異嗎?如果是這樣,'$ val-before $ val'後出現了什麼問題? (對於一個更大的集合,你可能想小心元素的順序是相同的,但是你給我們的數據應該沒問題?)否則,請編輯你的問題以提供更精確的問題(即,告訴我們這個特殊的小例子所期望的答案) –