2016-08-02 158 views
1

我有一個數據集Dplyr總結列

company_category_list Cluster 
Biotechnology   1 
Software    2 
Biotechnology|Search 1 
Biotechnology   1 
Biotechnology   1 
Enterprise Software 3 
Software    2 

我想由列集羣分組的第一列的數量,使得用下面的代碼:

library(dplyr) 
CountSummary <-SFBay_2012 %>% 
group_by(Cluster) %>% 
summarise(company_category_list_Count = count_(company_category_list)) 

但是,得到以下錯誤:

Error: no applicable method for 'group_by_' applied to an object of class "factor" 

任何人都可以幫忙嗎? 在此先感謝!

+0

是'count_'不應該是'合作沒有'?或者只是'n()'? – zx8754

+0

此外,您粘貼的代碼與您粘貼的錯誤之間存在差異。 「group_by_」與「group_by」不一樣 –

+0

這是整個代碼以及錯誤:CountSummary <-SFBay_2012%>% + group_by(集羣)%>% +彙總(company_category_list_Count = count(company_category_list)) 錯誤:沒有將「group_by_」應用於類「factor」 – user6016731

回答

0

我想我們需要

SFBay_2012 %>% 
     group_by(Cluster) %>% 
     count(company_category_list) 
# Cluster company_category_list  n 
# <int>     <chr> <int> 
#1  1   Biotechnology  3 
#2  1 Biotechnology|Search  1 
#3  2    Software  2 
#4  3 Enterprise Software  1 

或者

SFBay_2012 %>% 
     count(Cluster, company_category_list) 
# Cluster company_category_list  n 
# <int>     <chr> <int> 
#1  1   Biotechnology  3 
#2  1 Biotechnology|Search  1 
#3  2    Software  2 
#4  3 Enterprise Software  1 

或者

SFBay_2012 %>% 
     group_by(Cluster, company_category_list) %>% 
     tally() 
# Cluster company_category_list  n 
#  <int>     <chr> <int> 
#1  1   Biotechnology  3 
#2  1 Biotechnology|Search  1 
#3  2    Software  2 
#4  3 Enterprise Software  1 

或者