2017-05-21 51 views
-1

因此,讓我成爲一個更具體一點..... 我有了一個數據集我怎麼能總和因素分類變量和彙總

  1. SOCCERTEAM -PLAYERS

  2. BARCA - 梅西

  3. BARCA - MESSI
  4. BARCA - MESSI
  5. BARCA - XAVI

  6. -RM - CR

  7. -RM - CR

  8. -RM - PEPE

  9. -RM -HIQUAIN 等(只是一個例子並不數據集)

as columns !!!

我想這個問題的答案: *團隊可以使用的球員不止一次所以找到因子水平的可能性也不大「我怎麼能根據他們使用了多少玩家發現的前5名的球隊」 *所以如果使用巴薩15名球員和Rm使用14然後BARCA是第一.....

+0

嘗試'庫(data.table);頭部(setDT(DF1),(N = uniqueN(。 PLAYERS)),SOCCERTEAM] [order(-n)] $ SOCCERTEAM,5)' – akrun

+0

@akrun thnx尋求幫助......即使我找不到零件的使用,它仍然有效:..... [,。(n = uniqueN(PLAYERS)),SOCCERTEAM] [ord呃(-n)] $ SOCCERTEAM,5)...爲什麼在setDT(df1)之後我們使用[]? –

+0

你應該看看[data.table'入門](https://github.com/Rdatatable/data.table/wiki/Getting-started)。 – Gregor

回答

0
library(dplyr) 

df %>% 
    group_by(SOCCERTEAM) %>% 
    summarize(rank = n_distinct(PLAYERS)) %>% 
    top_n(5, wt = rank) 
+0

mutate_impl(.data,dots)中的錯誤:無效的下標類型'list' –

+0

也許嘗試將「rank」重命名爲其他內容。所以'總結(n_players = n_distinct(PLAYERS))%>%top_n(5,n_players)' – yeedle