我有一個包含很多變量的數據集。感興趣的有:ID,Episode,Start,End,Assessment Date。示例數據集顯示爲創建重複的開始和結束日期
ID Episode Start End AssessmentDate
1 1 1/1/2012 12/21/2012 1/1/2012
1 1 1/1/2010 12/21/2012 12/12/2012
1 1 1/1/2010 12/21/2012 12/21/2012
1 2 1/1/2013 . 1/2/2013
1 2 1/1/2013 . 2/2/2013
1 2 1/1/2013 . 3/2/2013
2 1 1/1/2012 . 4/1/2012
2 1 1/1/2010 . 5/12/2012
2 1 1/1/2010 . 6/21/2012
2 2 1/1/2013 . 7/2/2013
2 2 1/1/2013 . 8/2/2013
2 2 1/1/2013 . 9/2/2013
我對每個人都有開始日期,但沒有任何結束日期。我想確定每個病例和每個病人的結束日期,爲10,000個病人。我希望結束日期是每個劇集編號的最後一個評估日期,我希望在第一個評估日期和最後一個評估日期之間的每一行都有這個日期。
我正在讀一點關於根據ID和Episode將數據集分成許多較小的部分,但我覺得應該有一個更簡單的方法來做到這一點。我剛來R,來自SAS,SAS這樣的問題不會給我太多麻煩。
如果您對我的數據準備有任何意見,我將不勝感激。
我同意。您可能想要將示例數據更改爲能夠更好地表示實際數據的內容 – 2014-09-22 17:48:58