我想使用年份信息來計算年齡。我有以下特徵的數據集:根據年份的順序推算年齡
dat <- data.table(id = c(rep(1, 8), rep(2, 8)),
year = c(2007:2014, 2007:2014),
age = c(1, NA, 3, NA, NA, 5, 7, NA, NA, NA, 30, NA, 32, 35, NA, NA),
age_imp= c(1, 2, 3, 4, 5, 5, 7, 8, 28, 29, 30, 31, 32, 35, 36, 37)
)
id year age age_imp
1: 1 2007 1 1
2: 1 2008 NA 2
3: 1 2009 3 3
4: 1 2010 NA 4
5: 1 2011 NA 5
6: 1 2012 5 5
7: 1 2013 7 7
8: 1 2014 NA 8
9: 2 2007 NA 28
10: 2 2008 NA 29
11: 2 2009 30 30
12: 2 2010 NA 31
13: 2 2011 32 32
14: 2 2012 35 35
15: 2 2013 NA 36
16: 2 2014 NA 37
原始變量age
並不總是與一個每年持續時間(例如,一個採訪比以前的採訪中,測量誤差等,一年少加)所以我想保持它的樣子。對於NA行,我想逐年開始一個序列(例如,age_imp
)。
有關如何做到這一點的任何建議?
在新的例子,你要歸咎於兩列? – akrun