2017-08-06 97 views
1

我有如下數據集:彙總的時間序列數據保存日期列在Python

date   jobcategory 
2016-01-01  SP  
2016-01-01  DP 
2016-01-01  SP 
2016-01-01  CP 
2016-01-01  DP 
2016-01-01  DP 
2016-01-01  DP 
2016-01-02  SP 
2016-01-02  CP 
2016-01-02  SP 
2016-01-02  CP 
2016-01-02  DP 
2016-01-02  TP 
2016-01-02  DP 
2016-01-02  DP 
2016-01-02  DP 
2016-01-03  SP 
2016-01-03  SP 
2016-01-03  DP 
2016-01-03  DP 
2016-01-03  SP 
2016-01-03  DP 
2016-01-04  CP 
2016-01-04  MP  

我試圖聚集這mainting同時獲得在工作類別之一的計數獨特的日期字段第二欄如下:

date  jobcategory Count 
2016-01-01  SP  2 
2016-01-02  SP  2 
2016-01-03  SP  3 
2016-01-04  SP  0 

任何幫助將不勝感激。

+0

我推薦問一個新問題。我將設置標籤python,所以這應該有助於熊貓用戶。 –

回答

0

首先在date上使用df.groupby,然後在原始日期列中使用df.merge以獲得0計數。

In [921]: df[df.jobcategory == 'SP'].groupby('date', as_index=False).count().merge(df[['date']].drop_duplicates(), how='outer').fillna(0) 
Out[921]: 
     date jobcategory 
0 2016-01-01   2.0 
1 2016-01-02   2.0 
2 2016-01-03   3.0 
3 2016-01-04   0.0 
+0

非常感謝您的快速回復。不幸的是,我是一個新手,無法正確執行此代碼。我是否應該用\替代任何東西? – Sree

+0

@Sree不,你不能。這只是一個可讀性的續行字符。現在看看我的答案。 –

+0

@coldspeed再次感謝。我收到以下錯誤:「錯誤:意外的符號在」abends.jcat [abends.jcat $ jobcat ==「SP」]。groupby「! – Sree