我正在處理一個大數據集,並且遇到了數據清理問題。我的數據集是這樣的:刪除整個羣組或成員
data <- cbind (group = c(1,1,1,2,2,3,3,3,4,4,4,4,4),
member = c(1,2,3,1,2,1,2,3,1,2,3,4,5),
score = c(0,1,0,0,0,1,0,1,0,1,1,1,0))
我只是想保持在該得分的總和等於1的組和刪除整個組中得分的總和等於0。對於組其中分數的總和大於1,例如分數總和= 3,我想隨機選擇兩個分數等於1的組員,並將他們從組中刪除。然後數據可能看起來像這樣:
newdata <- cbind (group = c(1,1,1,3,3,4,4,4),
member = c(1,2,3,2,3,1,3,5),
score = c(0,1,0,0,1,0,1,0))
有沒有人可以幫助我做到這一點?
如果總分大於1,你是否總是刪除兩個組成員? – Chase
如果一個組的分數總和大於1,我想ramdoly選擇一個有1分的成員,並將其保留在組中,並刪除組中有1分的其他成員。在這種情況下,我會保留組中有0分的組員。 – user187454