我有一個數據文件,每個參與者一行(根據他們參與的研究命名爲1-x)。我想檢查是否所有參與者都存在於數據集中。這是我的玩具的數據集,PERSONID是參與者,研究他們在參加研究檢查計數器變量中的步驟是否丟失
df <- read.table(text = "personid study measurement
1 x 23
2 x 32
1 y 21
3 y 23
4 y 23
6 y 23", header=TRUE)
看起來像這樣:
personid study measurement
1 1 x 23
2 2 x 32
3 1 y 21
4 3 y 23
5 4 y 23
6 6 y 23
所以對於Y,我很想念參與者2和5 。我如何自動檢查?我嘗試添加一個計數器變量並將該計數器變量與參與者ID進行比較,但是一旦缺少一個參與者,比較就沒有意義,因爲對齊關閉。
df %>% group_by(study) %>% mutate(id = 1:n(),check = id==personid)
Source: local data frame [6 x 5]
Groups: date [2]
personid study measurement id check
<int> <fctr> <int> <int> <lgl>
1 1 x 23 1 TRUE
2 2 x 32 2 TRUE
3 1 y 21 1 TRUE
4 3 y 23 2 FALSE
5 4 y 23 3 FALSE
6 6 y 23 4 FALSE
什麼是你想在這裏所需的輸出?你只是試圖添加這個「檢查」列,以便數據庫中的每一行都是真的,如果該參與者在每個研究中? – MrFlick
也許「檢查」列的想法不理想,我期望的輸出是沿着「y缺少參與者2和5」的線,不關心格式。 – Esther