我使用的是Rstudio(版本.99.903),有一臺PC(Windows 8)。隨着問題變得更加複雜,我從昨天開始跟進一個問題。下面是數據的樣子:將最近的平均值與當前值進行比較R
Number Trial ID Open date Enrollment rate
420 NCT00091442 9 1/28/2005 0.2
1476 NCT00301457 26 2/22/2008 1
10559 NCT01307397 34 7/28/2011 0.6
6794 NCT00948675 53 5/12/2010 0
6451 NCT00917384 53 8/17/2010 0.3
8754 NCT01168973 53 1/19/2011 0.2
8578 NCT01140347 53 12/30/2011 2.4
11655 NCT01358877 53 4/2/2012 0.3
428 NCT00091442 55 9/7/2005 0.1
112 NCT00065325 62 10/15/2003 0.2
477 NCT00091442 62 11/11/2005 0.1
16277 NCT01843374 62 12/16/2013 0.2
17386 NCT01905657 62 1/8/2014 0.6
411 NCT00091442 66 1/12/2005 0
我需要做的是給定的ID內比較的最新日期的入學率平均那些長達一年之前,它是值的。例如,對於ID 53,2011年1月19日的日期註冊率爲0.2,我想將其與2010年8月17日和2010年5月12日的入學率(例如0.15)的平均值進行比較, 。
如果在當前ID之前的ID中沒有其他日期,則不應進行比較。例如,對於ID 26,就沒有比較。同樣,對於ID 53,5/12/2010將不會進行比較。
當我說「比較」時,我沒有做任何分析或可視化。我只想要一個新的列,這些列的入學率的平均值要比目前的一年的平均值高出一年(我將會密謀他們,並在百分位後面對他們進行排名)。有> 20,000個數據點。任何幫助將非常感激。