背景:,我試圖來過濾,但不正確的分組都使其難以的R - dplyr總結和清潔用多組數據幀
我大的數據幀。想象一下,你有一個具有分層類別的雜貨店的銷售信息。香蕉出現3次:2次爲「水果」,1次爲「肉」。我知道實際上發生了「肉類」銷售,所以我不想擺脫它,但它弄亂了我過濾的彙總數據(例如,我只想保留具有3個或更多實例的分組,但香蕉會消失)。
重現性實施例
x1 <- c('a','a','a','b','b','b')
x2 <- c(1,1,4,5,2,2)
x3 <- c(10,11,12,13,14,15)
df = data.frame(x1,x2,x3)
summarized = df %>%
group_by(x1, x2) %>%
summarize(Avg = mean(x3),
Times = n())
創建:
x1 x2 Avg Times
1 a 1 10.5 2
2 a 4 12.0 1
3 b 2 14.5 2
4 b 5 13.0 1
分組(A,1)發生超過(A,4),所以我知道(A,1)是正確的( (b,2)與(b,5)相同)。我在尋找我的數據幀成爲:
x1 x2 Avg Times
1 a 1 11 3
2 b 2 14 3
x2
重要的是我保持,因爲我的條件格式是基於(即,如果X2 == 1 & AVG < 10再落別人保持)。
我最好試圖做平均/計數分開,然後加上最大的X2?提前致謝!
試着給出一致的例子。雖然描述你用「香蕉」,「肉」來解釋它,但在你可重複的例子中,我沒有找到它們。 –
我注意到你迄今在SO上提出的6個問題沒有接受任何答案。請考慮接受解決您的疑問的答案。 –