2017-05-19 47 views
0

我有一個數據幀結構如下:如何用多列來總結「長」格式的數據框?

Variable 1 | Variable 2 | Variable 3 | Outcome Variable 
---------- | ---------- | ---------- | ---------------- 
Factor  | Factor  | Factor  | Outcome 

了幾千行,15列變量和1個輸出列。我想總結一下表格(最好使用plyr),格式如下:

Variable 1 | Variable 2 | Variable 3 | Outcome Variable 
---------- | ---------- | ---------- | ---------------- 
Factor 1 | Factor 1 | Factor 1 | Average Outcome 
Factor 1 | Factor 1 | Factor 2 | Average Outcome 
Factor 1 | Factor 2 | Factor 1 | Average Outcome 
Factor 1 | Factor 2 | Factor 2 | Average Outcome 

對於不同的變量組合。什麼是最簡單的方法來做到這一點?

+1

可以在基地R.使用聚合'骨料(結果〜FAC1 + FAC2 + FAC3,數據= DAT, FUN =平均值)'。 – lmo

回答

0

我們可以使用dplyr

library(dplyr) 
df1 %>% 
    group_by(variable1, variable2, variable3) %>% 
    summarise(OutcomeVariable = mean(OutcomeVariable)) 

或用base R

aggregate(OutcomeVariable ~., df1, FUN = mean) 
相關問題