我使用Python進行編碼。 Dataframe full_df具有以下特性: building_id和 log_price。我想calcute log_price通過分組的平均building_id和新功能 mean_log_price在 full_df根據其 building_id創建,存儲的 log_price的平均值。Python數據框 - 計算組和商店的平均值
我有以下代碼:
full_df['mean_log_price'] = full_df.groupby(['building_id'],as_index=False).agg(np.mean)['log_price']
然而,當我看着 full_df,一些值 mean_log_price爲NaN和一些值不正確我做了一些檢查後。爲什麼會發生這種情況,還有哪些替代方法?提前致謝。
是否有獨特的少'building_id's比行?那麼'mean_log_price'的列長將比'full_df'的列長短。 – Charlie