2016-08-24 31 views
1

我想找出員工排名前3位的價格,但保留地方欄。按ID排名前3位價格

這一切看起來是這樣的:

place<-c('Dest1', 'Dest2', 'Dest3', 'Dest4', 'Dest5', 'Dest6', 'Dest1', 'Dest2', 'Dest3', 'Dest4', 'Dest5', 'Dest6') 
rate <- c(0.5, 0.6, 0.7, 0.2, 0.5, 0.9, 0.8,0.9,0.2,0.5,0.3,0.7) 
employee <- c('A','A','A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B') 
employ.data <- data.frame(employee, rate, place) 

數據幀是這樣的:

employee rate place 
1   A 0.5 Dest1 
2   A 0.6 Dest2 
3   A 0.7 Dest3 
4   A 0.2 Dest4 
5   A 0.5 Dest5 
6   A 0.9 Dest6 
7   B 0.8 Dest1 
8   B 0.9 Dest2 
9   B 0.2 Dest3 
10  B 0.5 Dest4 
11  B 0.3 Dest5 
12  B 0.7 Dest6 

如何通過employee提取前3速率和保持place列好。我知道dplyr中的group_by如何處理,但是這將消除place列。

我想最後的結果是這樣的:

employee rate place 
2   A 0.6 Dest2 
3   A 0.7 Dest3 
6   A 0.9 Dest6 
7   B 0.8 Dest1 
8   B 0.9 Dest2 
12  B 0.7 Dest6 

謝謝!

+0

@akrun它不是一個重複的,但因爲我想保持'place'列。我知道如何使用'group_by'。 –

+0

對不起。我重新打開併發布了一個解決方案。請檢查。 – akrun

回答

1

經過'員工'分組後,我們可以從arrange'率'以降序排列,slice前3排。

employ.data %>% 
     group_by(employee) %>% 
     arrange(desc(rate)) %>% 
     slice(1:3) 

或者用filterrank通過 '員工' 分組後子集行。

employ.data %>% 
    group_by(employee) %>% 
    filter(rank(-rate) <4) 
#  employee rate place 
# <fctr> <dbl> <fctr> 
#1  A 0.6 Dest2 
#2  A 0.7 Dest3 
#3  A 0.9 Dest6 
#4  B 0.8 Dest1 
#5  B 0.9 Dest2 
#6  B 0.7 Dest6 

或用top_n這基本上是filter的包裝與min_rank

employ.data %>% 
     group_by(employee) %>% 
     top_n(3, wt=rate)