2012-09-17 134 views
-1

聽起來像一個微不足道的,但一些研究沒有提出一個優雅的解決方案: 我有一個數據框架結構與一個分類變量(GROUP)和連續讀出變量(血壓)。 如何製作一個簡單的箱形圖,顯示每個組的平均值及其標準偏差? 有多個組:A,B,C,D如何在數據框中執行ANOVA事後分析。它如何與Mann-Whitney-U-Test一起工作?我可以在條形圖中標記顯着性水平嗎? 如何將此操作簡化爲多個連續變量(dia_bloodpressure,sys_bloodpressure,mean_bloodpressure)和sink()不同文件中的輸出(通過變量的名稱)?R-Project中的Barplot平均值/ w SD

+0

..how許多問題都你問...?! –

+0

這對於一個問題有點多。也許你應該看看http://stackoverflow.com/faq#questions和http://stackoverflow.com/q/5963269/1317221,然後簡化你的問題 –

+0

好吧,我想這有點多一個發佈。但之後:這是典型的分析工作流程。到目前爲止,我遇到了處理其中一個問題的軟件包。它是1)多組測試2)很少有多組比較3)多組的比較小組,但從不具有顯着性水平。 – Doc

回答

0

經過一番研究,我想出了agricolae軟件包。這一個提供了多組比較。得到的對象可以流水線化爲一個體面的繪圖功能,用於羣組條形圖+/- SD或SEM。不幸的是,沒有辦法在地塊組間使用顯着性標記。

0

在R中進行了一些編程之後,我偶然發現了另一個適用於醫學研究的很好的軟件包:psych。 考慮到上面的問題,describe()describeBy()獲得了一個數據框的統計概覽並按分組變量排序。 功能error.bars.by()是平均值+/- SD的高級繪圖功能。 該軟件包提供了許多協變量分析功能,這些功能在心理學研究中很有用,但也可能有助於醫學和營銷研究。

0

一個可能的代碼片段:

library(psych) 

x<-c(1,2,3,4,5,6,7,8,9,NA) 
y<-c(2,3,NA,3,4,NA,2,3,NA,2) 
group<-rep((factor(LETTERS[1:2])),5) 
df<-data.frame(x,y,group) 
df 

by(df$x,df$group,summary) 
by(df$x,df$group,mean) 

sd(df$x) #result: NA 
sd(df$x, na.rm=TRUE) #result: 2.738613 

v = c("x", "y")#or 
v = colnames(df)[1:2] 
sapply(v, function(i) tapply(df[[i]], df$group, sd, na.rm=TRUE)) 

describeBy(df$x, df$group) 

error.bars.by(df$x, df$group, bars=TRUE)