我有類的數據框,包含名稱,性別(女性,男性)和身高的變量。我需要根據性別計算高度變量的描述性統計。我想在輸出中的以下內容,任何幫助將不勝感激。如何計算描述性統計
Gender
,Freq
,Mean
,Median
,Mode
,Std
,Dev
,min
,max
我有類的數據框,包含名稱,性別(女性,男性)和身高的變量。我需要根據性別計算高度變量的描述性統計。我想在輸出中的以下內容,任何幫助將不勝感激。如何計算描述性統計
Gender
,Freq
,Mean
,Median
,Mode
,Std
,Dev
,min
,max
嘗試使用此
# assuming df is your data.frame and gender, height are column names
tapply(df$height, df$gender, function(grp) c(Freq = length(grp), mean = mean(grp),mode = mode(grp),SD = sd(grp),min = min(grp),max = max(grp)))
功能summarise()
從包dplyr
將是一個很好的解決方案:
library('dplyr')
df %>%
na.omit %>%
group_by(gender) %>%
summarise(Freq = n(), #unshure, maybe n()/NROW(df)
Mean = mean(height),
Median = median(height),
Mode = moda(height),
Std.Dev = sd(height),
min = min(height),
max = max(height))
凡moda(x)
是功能estimatin模式用於從連續可變樣品:
moda <- function(x, na.omit = TRUE){
if (na.omit) x <- na.omit(x)
d <- density(x)
return(d$x[which.max(d$y)])
}
謝謝你安德烈Kolyadin –
在我的數據高度變量有缺失值,所以得到錯誤 summarise_impl(.data,點)錯誤:'x'包含缺失值 是否可能提及如果條件在上述過程 –
作出一些編輯,現在應該工作 –
提供一個[再現的](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r - 可重複的例子)的例子。 – Prradep
沒有數據?沒有例子?請遵循如何發佈問題的指導原則。謝謝 –
你做了什麼研究? – Elin