我有兩個這樣dataframes:填充值的從另一列的總和列中指定的時間間隔在熊貓
df1 df2
col1 col2 col3 col1 col2
item1 14 NaN item1 3
item1 28 NaN item2 4
item1 6 NaN ...
item1 16 NaN
item1 7 NaN
item1 25 NaN
item1 11 NaN
item1 17 NaN
item1 10 NaN
item1 22 NaN
item2 21 NaN
item2 25 NaN
item2 24 NaN
item2 25 NaN
item2 16 NaN
item2 15 NaN
item2 26 NaN
item2 14 NaN
item2 16 NaN
item2 30 NaN
...
我需要在數據幀df1
填充柱col3
用的總和值在df1
的列col2
中,在數據幀df2
中指定的時間間隔內。對於數據幀df1
的列col1
中的每個唯一值,它是唯一的,並在df2
的列col2
中指示。但與此同時,如果df1
中col2
列中的值不足,則只能總結那些值。我需要爲df1
的col1
列中的每個唯一值獲得這樣的數量。
結果應該是這樣的:
col1 col2 col3
item1 14 48
item1 28 50
item1 6 29
item1 16 48
item1 7 43
item1 25 53
item1 11 38
item1 17 49
item1 10 32
item1 22 22
item2 21 95
item2 25 90
item2 24 80
item2 25 82
item2 16 71
item2 15 71
item2 26 86
item2 14 60
item2 16 46
item2 30 30
...
下面是如何計算的item1
時的例子:
col1 col2 calculations for col3
item1 14 (14 + 28 + 6) =48
item1 28 (28 + 6 + 16) =50
item1 6 (6 + 16 + 7) =29
item1 16 (16 + 7 + 25) =48
item1 7 (7 + 25 + 11) =43
item1 25 (25 + 11 + 17) =53
item1 11 (11 + 17 + 10) =38
item1 17 (17 + 10 + 22) =49
item1 10 (10 + 22 ) =32
item1 22 (22 ) =22
的問題是,有很多獨特的價值觀在df1
的列col1
和列col2
列df2
中指定的時間間隔可以每次都不同。
我將不勝感激任何幫助!
你嘗試過這麼遠嗎? –