我曾問過這個問題之前:python pandas: applying different aggregate functions to different columns 但最新的變化大熊貓https://github.com/pandas-dev/pandas/pull/15931 意味着什麼,我想到的是一個優雅和Python的解決方案已被棄用,原因我真的不明白。應用不同的聚合函數不同的列(現在重命名該字典已過時)
問題是,現在仍然是:在做groupby時,如何將不同的集合函數應用於不同的領域(例如x的總和,x的平均值,y的最小值,z的最大值等)並重命名所產生的田地,一氣呵成,或者至少是以一種可能是pythonic而不是太笨重的方式?即sum_x不會,我需要顯式重命名這些字段。
這種做法,我很喜歡:
df.groupby('qtr').agg({"realgdp": {"mean_gdp": "mean", "std_gdp": "std"},
"unemp": {"mean_unemp": "mean"}})
將被棄用,現在產生這樣的警告:
FutureWarning: using a dict with renaming is deprecated and will be removed in a future version
謝謝!
單行你來到這裏的答案https://stackoverflow.com/questions/44635626/pandas-aggregation-warning-futurewarning-using-a -dict-with-renaming-is-depreca – Wen
但是,正如@ErnestScribbler對這個答案發表評論,那不涉及重命名。我想它必須手動完成?對於有大量列的大型數據框,這意味着我不僅需要替換舊的代碼,而且新代碼還要更長。所有這些爲什麼? –