0
我有數據幀是這樣的:如何聚集的一些數據在數據幀的大熊貓
df = pd.DataFrame({'id': [115,120,200], 'category': ['a','a', 'b'], 'clust': [1, 2, 3]})
我想要聚合和計數每一個類別,這是特別clust的ID的數量。例如,結果可以還數據幀,其中索引行是clust和索引列是類別和值的id的量
我有數據幀是這樣的:如何聚集的一些數據在數據幀的大熊貓
df = pd.DataFrame({'id': [115,120,200], 'category': ['a','a', 'b'], 'clust': [1, 2, 3]})
我想要聚合和計數每一個類別,這是特別clust的ID的數量。例如,結果可以還數據幀,其中索引行是clust和索引列是類別和值的id的量
IIUC,讓我們使用groupby
和unstack
:
import pandas as pd
df = pd.DataFrame({'id': [115,120,200], 'category': ['a', 'a', 'b'], 'clust': [1, 2, 3]})
df
輸入數據幀:
category clust id
0 a 1 115
1 a 2 120
2 b 3 200
集團,aggegrate重塑:
df_out = df.groupby(['clust','category'])['id'].count().unstack()
輸出:
category a b
clust
1 1.0 NaN
2 1.0 NaN
3 NaN 1.0