2
考慮以下數據框:通過玩熊貓電子表格類似的表格
我來了很遠:
import pandas as pd
import numpy as np
df = pd.DataFrame({
'split_1':[1,2,2,2,1,2,2,2,1,1],
'split_2':[3,3,3,4,4,4,4,3,3,3],
'var_1':[1,2,4,3,2,4,2,2,1,2],
'var_2':[4,2,2,2,1,5,4,3,4,3],
})
我想才達到是一個表格,類似(或完全相同)這樣的用groupby和agg方法。
grp = df.groupby(['split_1','split_2'])
tab1 = grp['var_1'].agg([np.mean, np.median, np.max, np.min, np.size])
tab2 = grp['var_2'].agg([np.mean, np.median, np.max, np.min, np.size])
tab = tab1.append(tab2)
這似乎hackish的......我似乎無法找到一種方法(或文檔看起來正確的地方),以適當的組並聚集在我想要的數據。
有沒有正確的方法?
謝謝!另外:我可以用這種方法得到我的確切格式,並在DataFrame上調用'''reset_index()'''。 – madflow