我可以讓你更具有describe
df.groupby('state')['numeric data'].describe().unstack().to_dict('index')
{'ALASKA': {'25%': 342.0,
'50%': 342.0,
'75%': 342.0,
'count': 1.0,
'max': 342.0,
'mean': 342.0,
'min': 342.0,
'std': nan},
'CALIFORNIA': {'25%': 234.0,
'50%': 234.0,
'75%': 234.0,
'count': 1.0,
'max': 234.0,
'mean': 234.0,
'min': 234.0,
'std': nan},
'TEXAS': {'25%': 756.0,
'50%': 756.0,
'75%': 756.0,
'count': 1.0,
'max': 756.0,
'mean': 756.0,
'min': 756.0,
'std': nan}}
保持它只是mean
和std
選項1
df.groupby('state')['numeric data'].agg(['mean', 'std']).to_dict('index')
{'ALASKA': {'mean': 342.0, 'std': nan},
'CALIFORNIA': {'mean': 234.0, 'std': nan},
'TEXAS': {'mean': 756.0, 'std': nan}}
選項2
df.groupby('state')['numeric data'].describe().unstack()[['mean', 'std']].to_dict('index')
{'ALASKA': {'mean': 342.0, 'std': nan},
'CALIFORNIA': {'mean': 234.0, 'std': nan},
'TEXAS': {'mean': 756.0, 'std': nan}}
這是一種更好的答案比我一直在尋找!非常感謝!我會盡快接受這個答案。 – rubito
如果'numericdata'實際上是'數字數據'會怎麼樣? – rubito
@rubito我已更新我的帖子 – piRSquared