根據其他列中的因子計算一列中R的平均值和標準偏差

我想計算「skada」列中取決於另外三列的數據的平均值和標準偏差。我的表看起來像這樣：根據其他列中的因子計算一列中R的平均值和標準偏差

的「geografi」列有分類變量：SV，NV，男，SO，SV

的「gradering」列有分類變量：1，2

的「制地圖」列具有分類變量：20M，康德

換句話說，這意味着我將不得不爲SV，1,2-平均值和標準偏差0米; SV，2,20m; SV，1，康得; SV，2，康德; NV，1,20米......等等。有沒有人有關於如何輕鬆做到這一點的任何提示？

乾杯！

畫面不重複的例子 – simone

型'data.table'或看'dplyr'的'？ group_by' – simone

您可以使用data.table：

library(data.table) 

setDT(data)[, list(skada_mean = mean(skada), skada_sd = sd(skada)), 
       by = c("geografi", "gardering", "plats")]

或dyplr：

library(dplyr) 

data %>% 
    group_by(geografi, gardering, plats) %>% 
    summarise(skada_mean = mean(value), skada_sd = sd(value))

2017-07-28 14:00:07 gcons

非常感謝gcons。我試過data.table，它工作得很完美。從現在開始，對於大量表格，沒有更多的優勢。 –

回答