2016-11-30 96 views
-4

我有類的數據框,包含名稱,性別(女性,男性)和身高的變量。我需要根據性別計算高度變量的描述性統計。我想在輸出中的以下內容,任何幫助將不勝感激。如何計算描述性統計

GenderFreqMeanMedianModeStdDevminmax

+0

提供一個[再現的](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r - 可重複的例子)的例子。 – Prradep

+0

沒有數據?沒有例子?請遵循如何發佈問題的指導原則。謝謝 –

+0

你做了什麼研究? – Elin

回答

0

嘗試使用此

# assuming df is your data.frame and gender, height are column names 
tapply(df$height, df$gender, function(grp) c(Freq = length(grp), mean = mean(grp),mode = mode(grp),SD = sd(grp),min = min(grp),max = max(grp))) 
1

功能summarise()從包dplyr將是一個很好的解決方案:

library('dplyr') 
df %>% 
    na.omit %>% 
    group_by(gender) %>% 
    summarise(Freq = n(), #unshure, maybe n()/NROW(df) 
      Mean = mean(height), 
      Median = median(height), 
      Mode = moda(height), 
      Std.Dev = sd(height), 
      min = min(height), 
      max = max(height)) 

moda(x)是功能estimatin模式用於從連續可變樣品:

moda <- function(x, na.omit = TRUE){ 
    if (na.omit) x <- na.omit(x) 
    d <- density(x) 
    return(d$x[which.max(d$y)]) 
} 
+0

謝謝你安德烈Kolyadin –

+0

在我的數據高度變量有缺失值,所以得到錯誤 summarise_impl(.data,點)錯誤:'x'包含缺失值 是否可能提及如果條件在上述過程 –

+0

作出一些編輯,現在應該工作 –