所以這給出了我所需要的整個列表:獲取最大頻率只爲每一個因素
max <- function(x) {
n <- data.frame(x)
factored <- n[sapply(n, is.factor)]
dt_res = data.frame()
for (i in 1:ncol(factored)) {
dt_temp = data.frame(t(table(factored[, i])))
dt_temp$Var1 = names(factored)[i]
dt_res = rbind(dt_res, dt_temp)
}
names(dt_res) = c("Factors", "Categories", "Frequency")
return(dt_res)
}
如何獲得每個因素的最高頻率是多少?隨着鑽石鑲嵌,我得到
Factors Categories Frequency
cut Fair 1610
cut Good 4906
cut Very Good 12082
cut Premium 13791
cut Ideal 21551
color D 6775
color E 9797
color F 9542
color G 11292
color H 8304
color I 5422
color J 2808
和類別爲清楚,但我想它返回此:
Factors Categories Frequency
cut Ideal 21551
color G 11292
clarity SI1 13065
感謝
我打算在我的函數中使用它,所以它不會爲不被切斷等欄目,色彩和清晰度工作。我試過dt_temp = data.frame(max(t(table(factorored [,i]))))只是爲了獲得因素和頻率,而不是類別。 –
我會盡可能避免循環。如果您願意,您可以選擇其他列。看到我編輯的答案。 – CPak