2
伯爵表和百分比表下面的腳本說明我的問題:「疊加」中的R
library(reshape2)
set.seed(1)
dummy.df <- data.frame(var_a=sample(letters[1:5],200,replace=TRUE),
var_b=sample(1:5,200,replace=TRUE),
stringsAsFactors=FALSE)
temp1 <- addmargins(table(dummy.df[,c("var_a","var_b")]),1)
temp2 <- formatC(addmargins(prop.table(table(dummy.df[,c("var_a","var_b")]),2),1)*100,digits=2,format="f")
temp1.melt <- melt(temp1,id.vars="var_a")
temp2.melt <- melt(temp2,id.vars="var_a")
temp.output <- merge(temp1.melt,temp2.melt,by=c("var_a","var_b"))
temp.output[,"value"] <- paste(temp.output[,"value.x"]," (",temp.output[,"value.y"],"%)",sep="")
temp.output[,"var_a"] <- factor(temp.output[,"var_a"],levels=c("a","b","c","d","e","Sum"))
temp.output <- dcast(temp.output,formula=var_a~var_b,value.var="value")
我的一個辦公室平時工作是創建的表格,列出不同的變量之間的頻率,通常我會包括表中的百分比(行/列百分比)也是如此。
之前,我知道函數addmargins
,prop.table
和as.data.frame.matrix
,我使用大量melt
和dcast
從reshape2
包這樣的伎倆(即將表格轉換爲數據幀,melt
它,做相應的部門給予的百分比,然後它)。現在我知道使用三種新的學習功能可以爲我節省很多代碼。
現在我想知道這是否可以提前一步,而不使用我上面提供的腳本,並創建一個行/列的百分比表旁邊的實際計數的表?
啊,它是接近的,但是您的表列數減去了一倍 – lokheart
不確定你的意思。你是指第一列不是組標籤的事實嗎?如果是這樣,就處理好了。 –
@DWin可能會建議用矩陣(seq(1,ncol(temp1)* 2),ncol(temp1),2)'替換矩陣(1:10,5,2)'...... – agstudy