2017-07-07 74 views
0

我有數據幀是這樣的:如何聚集的一些數據在數據幀的大熊貓

df = pd.DataFrame({'id': [115,120,200], 'category': ['a','a', 'b'], 'clust': [1, 2, 3]}) 

我想要聚合和計數每一個類別,這是特別clust的ID的數量。例如,結果可以還數據幀,其中索引行是clust和索引列是類別和值的id的量

回答

0

IIUC,讓我們使用groupbyunstack

import pandas as pd 
df = pd.DataFrame({'id': [115,120,200], 'category': ['a', 'a', 'b'], 'clust': [1, 2, 3]}) 
df 

輸入數據幀:

category clust id 
0  a  1 115 
1  a  2 120 
2  b  3 200 

集團,aggegrate重塑:

df_out = df.groupby(['clust','category'])['id'].count().unstack() 

輸出:

category a b 
clust    
1   1.0 NaN 
2   1.0 NaN 
3   NaN 1.0