彙總的時間序列數據保存日期列在Python

我有如下數據集：彙總的時間序列數據保存日期列在Python

date   jobcategory 
2016-01-01  SP  
2016-01-01  DP 
2016-01-01  SP 
2016-01-01  CP 
2016-01-01  DP 
2016-01-01  DP 
2016-01-01  DP 
2016-01-02  SP 
2016-01-02  CP 
2016-01-02  SP 
2016-01-02  CP 
2016-01-02  DP 
2016-01-02  TP 
2016-01-02  DP 
2016-01-02  DP 
2016-01-02  DP 
2016-01-03  SP 
2016-01-03  SP 
2016-01-03  DP 
2016-01-03  DP 
2016-01-03  SP 
2016-01-03  DP 
2016-01-04  CP 
2016-01-04  MP

我試圖聚集這mainting同時獲得在工作類別之一的計數獨特的日期字段第二欄如下：

date  jobcategory Count 
2016-01-01  SP  2 
2016-01-02  SP  2 
2016-01-03  SP  3 
2016-01-04  SP  0

任何幫助將不勝感激。

來源

2017-08-06 Sree

我推薦問一個新問題。我將設置標籤python，所以這應該有助於熊貓用戶。 –

首先在date上使用df.groupby，然後在原始日期列中使用df.merge以獲得0計數。

In [921]: df[df.jobcategory == 'SP'].groupby('date', as_index=False).count().merge(df[['date']].drop_duplicates(), how='outer').fillna(0) 
Out[921]: 
     date jobcategory 
0 2016-01-01   2.0 
1 2016-01-02   2.0 
2 2016-01-03   3.0 
3 2016-01-04   0.0

來源

2017-08-06 19:58:21

非常感謝您的快速回復。不幸的是，我是一個新手，無法正確執行此代碼。我是否應該用\替代任何東西？ – Sree

@Sree不，你不能。這只是一個可讀性的續行字符。現在看看我的答案。 –

@coldspeed再次感謝。我收到以下錯誤：「錯誤：意外的符號在」abends.jcat [abends.jcat $ jobcat ==「SP」]。groupby「！ – Sree

彙總的時間序列數據保存日期列在Python

回答

相關問題