這顯然很簡單,但作爲一個熊貓newbe我卡住了。大熊貓的兩列分組
我有一個CSV文件,其中包含3列,國家,bene_1_count和bene_2_count。
我想計算給定狀態下'bene_1_count'和'bene_2_count'的比率。
df = pd.DataFrame({'state': ['CA', 'WA', 'CO', 'AZ'] * 3,
'bene_1_count': [np.random.randint(10000, 99999)
for _ in range(12)],
'bene_2_count': [np.random.randint(10000, 99999)
for _ in range(12)]})
我嘗試以下,但它給我一個錯誤: 「無對象來連接」
df['ratio'] = df.groupby(['state']).agg(df['bene_1_count']/df['bene_2_count'])
我無法弄清楚如何「可達」的以組的狀態級別來取列的比例。
我需要的列比w.r.t的狀態,就像我希望我的輸出如下:
State ratio
CA
WA
CO
AZ
Thanks..it正在工作...但它返回一個系列類型,但我想追加計算比例到列數據幀像df ['ratio'] .. – Sanjeev
我更新了我的帖子以將比率添加回原始數據幀。這是你尋找的結果嗎? – rtk22
太棒了...它正在工作.. – Sanjeev