我有一個按帳戶ID進行銷售的時間序列。要計算平均增長率,我需要爲每個ID提取非零銷售額的第一個月。由於該帳戶可能已在不同時間建立,因此我需要在帳戶中首次動態確定銷售額> 0的時間。在數據框中查找第一個非零值
該行的索引足以讓我傳遞給計算增長的函數。所以我期望通過帳戶ID得到以下結果:
54 - [1]
87 - [4]
95 - [2]
I tried `apply(df$Sales,2,match,x>0)` but this doesn't work.
任何指針?另外,有沒有一種更簡單的方法來計算這個數據集的CAGR?
在此先感謝!
CalendarMonth ID Sales
8/1/2008 54 6692.60274
9/1/2008 54 6476.712329
10/1/2008 54 6692.60274
11/1/2008 54 6476.712329
12/1/2008 54 11098.60822
7/1/2008 87 0
8/1/2008 87 0
9/1/2008 87 0
10/1/2008 87 18617.94155
11/1/2008 87 18017.36279
12/1/2008 87 18617.94155
1/1/2009 87 18617.94155
2/1/2009 87 16816.20527
7/1/2008 95 0
8/1/2008 95 8015.956284
9/1/2008 95 0
10/1/2008 95 8015.956284
11/1/2008 95 6309.447514
12/1/2008 95 6519.762431
1/1/2009 95 6519.762431
你是說你想要銷售非零的ID的條目子集中的那一行索引?因爲只有你爲這個表子集,87的4纔是9,否則就是9(從上數)。 –
是的,這是正確的。我還沒有完全想到如何,但與plyr和ggplot,我有工作的ID子集的願景,有效地計算和顯示平均增長統計。 – user1100825