我想在電子表格中執行一些看起來很容易的事情,但我無法在熊貓中找到語法。我有一個可以分組的數據集。我想確定每個組的聚合統計信息,但是然後使用聚合在原始數據框中創建一個新列。使用熊貓將聚合應用到原始數據框中
例如,如果我的數據幀是這樣的:
d = pandas.dataframe({'class', : ['f1', 'f2', 'f3', 'f1'],
'user': ['jack', 'jen', 'joe', 'jan'],
'screen': [12, 23, 13, 15] })
是它比我的數據集
我想這樣做
d['gp'] = d['screen'].apply(d.groupby('class').stdev())
,並保證要小得多d.groupby()。stdev()實際上是該行的該類的stdev。換句話說,我不想在計算類f2的gp時使用類f1的stdev。
我的大腦正在以電子表格模式或python for循環思考。我知道必須有一個簡單的熊貓語法才能做到這一點 - 但到目前爲止,我沒有在我的搜索中找到任何似乎符合我的用例的東西。
沒錯。我有我的信 – Dark
不一樣的信。我需要將聚合操作應用於原始數據框。但每個同意op(平均值,標準開發)必須爲每個組計算 - 因此該組按 –
您是否需要'd ['screengrade'] = d.groupby('class')['screen']。transform lambda x:x /(x.std()+ x.mean())* 200)'?我只用手機,所以未經測試。 – jezrael