1
我有一個數據幀df
,與lon
,lat
和label
列相當於大熊貓的功能,以該R聚集
我想執行該R聚集相當於:
mean_labels <- aggregate(cbind(lon, lat) ~ label, data=df, FUN=mean)
但它顯著太不可思議爲了我。至於我可以告訴大家,它的計算lat
,lon
值的平均值爲每組label
值的DF
不過,我不知道如何使用熊貓數據幀來實現這一目標。我可以很容易地按label
進行分組,但我不知道如何計算每個組內的均值lon
和lat
值。
我認爲你可以直接調用'GroupBy'對象的'mean',並且它會比將'np.mean'傳遞到'agg'更快。並且將處理'NaN'值,除非該函數的名稱映射到一個瓶頸或numpy nan函數 –
@cpcloud好點!我想每個人都會同意熊貓的語法更好...... :) –