我有數據幀df,我想保留一個數據幀的列中出現的名稱的總數。我試圖計算運行總計列:計算運行總數
name running total
a 1
a 2
b 1
a 3
c 1
b 2
有兩種方法,我認爲要做到這一點:
遍歷數據框,並使用包含名稱和當前計數一個單獨的字典。每次執行循環時,相關名稱的當前計數會增加1,並且該值將被複制到我的數據框中。
更改數據框中每個值的字段計數。在Excel中,我將使用一個countif結合一個下拉公式A $ 1:A1來修正第一個值,但是使第二個值相對變化,以便我查找的範圍隨着行而變化。
問題是我不知道如何實現這些。有沒有人有任何想法是可取的,以及如何實施這些想法?
如果你使用的大熊貓檢查出['cumcount'(http://pandas.pydata.org/pandas-docs/stable/generated/pandas.core.groupby.GroupBy.cumcount.html)功能 – bunji