我們擁有數千萬行數據庫,其中可以在重疊期間實施相同的策略。R - 如何獲得不帶循環的重疊觀測數據的年份總數
我們有類似的東西:
Policy ID Start Date End Date
A 01/01/2010 01/06/2010
A 01/01/2010 01/02/2010
A 01/03/2010 01/10/2010
我們希望得到一個變量等於一年的總部分在此期間,政策的一項是「積極的」,但不包括重疊。我們可以創建一個新的變量,其中包括每個觀測值的年份。
Policy ID Start Date End Date Portion of Year
A 01/01/2010 01/06/2010 5/12
A 01/01/2010 01/02/2010 1/12
A 01/03/2010 01/10/2010 7/12
我們不能,但是,總結的時期,因爲它們有時重疊:結果將是13/12直接相加,而真正的結果應該是一年的對應01/01/2010部分-01/10/2010。如何得到沒有循環的結果?
我們想過使用月假人
謝謝!
我前一個類似的問題。我也沒有,我沒有設法解決它沒有循環,對我來說是必要的。解決方案是計算每個組的時間段的獨特連續時間(在您的策略ID中)。有了這些,你可以計算id變量的活動週期。但它是一個循環的解決方案..你想避免。 –