2015-12-01 172 views
0

我有一個datafame認爲是這樣的分組由蟒蛇大熊貓唯一值數據框中

     id rev  committer_id 
date     
1996-07-03 08:18:15  1 76620 1 
1996-07-03 08:18:15  2 76621 2 
1996-11-18 20:51:08  3 76987 3 
1996-11-21 09:12:53  4 76995 2 
1996-11-21 09:16:33  5 76997 2 
1996-11-21 09:39:27  6 76999 2 
1996-11-21 09:53:37  7 77003 2 
1996-11-21 10:11:35  8 77006 2 
1996-11-21 10:17:50  9 77008 2 
1996-11-21 10:23:58  10 77010 2 
1996-11-21 10:32:58  11 77012 2 
1996-11-21 10:55:51  12 77014 2 

我想通過每季度期間組,然後顯示出獨特的條目在committer_id列數。列IDrev實際上暫時不使用。

我想有一個結果,如下 committer_id

date  
1996-09-30 2 
1996-12-31 91 
1997-03-31 56 
1997-06-30 154 
1997-09-30 84 

的實際結果是通過在每個時間段的條目數,而不是由唯一條目彙總。我正在使用以下內容:

df[['committer_id']].groupby(pd.Grouper(freq='Q-DEC')).aggregate(np.size) 

無法計算如何使用np.unique。

任何想法,請。

最佳,

-

回答

2
df[['committer_id']].groupby(pd.Grouper(freq='Q-DEC')).aggregate(pd.Series.nunique) 

應該爲你工作。或df.groupby(pd.Grouper(freq='Q-DEC'))['committer_id'].nunique()

您嘗試使用np.unique不起作用,因爲它會返回一個唯一項目數組。 agg的結果必須是標量。所以.aggregate(lambda x: len(np.unique(x))可能也會起作用。

+0

所有建議的解決方案都有效。謝謝。 – iganchev