2015-06-02 115 views
44

藉此樣品變量ř擴頻的多個列與tidyr

df <- data.frame(month=rep(1:3,2), 
       student=rep(c("Amy", "Bob"), each=3), 
       A=c(9, 7, 6, 8, 6, 9), 
       B=c(6, 7, 8, 5, 6, 7)) 

我可以使用spreadtidyr此更改爲寬格式。

> df[, -4] %>% spread(student, A) 
    month Amy Bob 
1  1 9 8 
2  2 7 6 
3  3 6 9 

但我該如何傳播兩個值,例如既AB,使得輸出是一樣的東西

month Amy.A Bob.A Amy.B Bob.B 
1  1  9  8  6  5 
2  2  7  6  7  6 
3  3  6  9  8  7 

回答

95

下面是使用data.table

library(data.table) ## v >= 1.9.6 
dcast(setDT(df), month ~ student, value.var = c("A", "B")) 
# month Amy_A Bob_A Amy_B Bob_B 
# 1:  1  9  8  6  5 
# 2:  2  7  6  7  6 
# 3:  3  6  9  8  7 

或可能tidyr解決

df %>% 
    gather(variable, value, -(month:student)) %>% 
    unite(temp, student, variable) %>% 
    spread(temp, value) 

# month Amy_A Amy_B Bob_A Bob_B 
# 1  1  9  6  8  5 
# 2  2  7  7  6  6 
# 3  3  6  8  9  7 
+0

我有可能既簡單又非常有效的解決方案同樣的問題,但我有一些幾個學生,A和B多個條目。該代碼給出了以下錯誤:錯誤:行的重複標識符。請幫忙。 –

+1

@PolarBear你想如何處理愚蠢?你想總結一下嗎?意思?嘗試'data.table'解決方案並將'fun.aggregate = sum'添加到'dcast'中 –

+0

我想在tidyr的幫助下取中位數的模糊數 –