2017-10-16 70 views
0

我有一個csv文件,其中包含15個記錄,其中包含類別/子類別。sqldf:如何根據類別分組子類別

列:Main_category,Sub_category,計數
所需的結果:類別,Sub_cat1,50

我嘗試了使用Python大熊貓,並得到了上述結果:

test = pd.DataFrame(df.groupby(['Main_category','Sub_category']['Sub_category'].count()) 

我想在R中使用sqldf實現相同,但不會獲得某個類別的每個子類別的計數。它只是顯示總數:

sqldf("select Main_category, Sub_category, count(*) from MyData group by Main_category") 
+0

請參閱[MCVE] –

+0

如果您Main_category'有'小組,由Main_category,Sub_category'將其更改爲'組 – Gregor

回答

2

如果我看純粹的SQL查詢,好像你必須按雙方聚集尺寸,Main_categorySub_category,爲了在SQL查詢,甚至在大多數SQL語言編譯:

sqldf("select Main_category, Sub_category, count(*) from MyData group by Main_category, Sub_category")