我試圖從數據框中計算出家庭規模,其中還包含兩類事件:死亡的家庭成員和離開家人的家庭成員。我想考慮這兩個參數來計算實際的家庭規模。 這是我的問題的生殖例如,僅具有3個家族:來自數據幀的R計數和減法事件
family <- factor(rep(c("001","002","003"), c(10,8,15)), levels=c("001","002","003"), labels=c("001","002","003"), ordered=TRUE)
dead <- c(0,0,0,0,1,0,1,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,1,0,1,0,0,0,0,0,0,0)
left <- c(0,0,0,0,0,1,0,0,0,1,1,0,0,0,1,1,0,0,0,1,1,1,0,0,0,0,0,0,1,1,1,0,0)
DF <- data.frame(family, dead, left) ; DF
我能數N =總家族成員(在每個家庭)在第二數據幀DF2,通過簡單地使用表()
DF2 <- with(DF, data.frame(table(family)))
colnames(DF2)[2] <- "N" ; DF2
family N
1 001 10
2 002 8
3 003 15
但我找不到一個合適的方法來獲取實際人數(例如,創建一個新的變量N2到DF2中),通過減去N來計算死亡或離開家庭的成員數量。我想我必須以某種方式將兩個數據幀DF和DF2聯繫起來。我已經在這個網站尋找其他相關的問題,但找不到正確的答案... 如果任何人有一個好主意,這將是偉大的! 預先感謝您.. 傑尼
'library(dplyr); DF%>%group_by(family)%>%summarize(n() - sum(dead)-sum(left))' –