0

我想計算「skada」列中取決於另外三列的數據的平均值和標準偏差。我的表看起來像這樣:enter image description here根據其他列中的因子計算一列中R的平均值和標準偏差

的 「geografi」 列有分類變量:SV,NV,男,SO,SV

的 「gradering」 列有分類變量:1,2

的「制地圖」列具有分類變量:20M,康德

換句話說,這意味着我將不得不爲SV,1,2-平均值和標準偏差0米; SV,2,20m; SV,1,康得; SV,2,康德; NV,1,20米......等等。有沒有人有關於如何輕鬆做到這一點的任何提示?

乾杯!

+0

畫面不重複的例子 – simone

+0

型'data.table'或看'dplyr'的'? group_by' – simone

回答

1

您可以使用data.table:

library(data.table) 

setDT(data)[, list(skada_mean = mean(skada), skada_sd = sd(skada)), 
       by = c("geografi", "gardering", "plats")] 

或dyplr:

library(dplyr) 

data %>% 
    group_by(geografi, gardering, plats) %>% 
    summarise(skada_mean = mean(value), skada_sd = sd(value)) 
+0

非常感謝gcons。我試過data.table,它工作得很完美。從現在開始,對於大量表格,沒有更多的優勢。 –

相關問題