我有類似下面一個數據集:如何僅對R中另一列具有多個不同值的行進行子集分類?
zz <- "Session Rater
1 A X
2 A X
3 A X
4 B Y
5 B Y
6 B Z
7 B Z
8 C X
9 C Y
10 C Z"
Data <- read.table(text=zz, header = TRUE)
我想只子集該會議有多個評價者會話行,即使該數據存儲在另一列。因此,我想結束了一個數據集,看起來像這樣:
zz2 <- "Session Rater
1 B Y
2 B Y
3 B Z
4 B Z
5 C X
6 C Y
7 C Z"
Data2 <- read.table(text=zz2, header = TRUE)
當會話一個行被從數據集中刪除,因爲會話一個只有一個評價者,「X」,但會議B和C(和它們的所有行)被保留,因爲它們具有多於一個評估者(對於會話B是Y & Z,對於會話C是X,Y,& Z)。
我玩過dplyr
,但沒有成功。非常感謝。
本質上在http://stackoverflow.com/questions/21421031/eliminate-groups-which-have-different-values-in-r/21421184的對面,可以說是一個重複的假設,你必須改變'=='到'> ',但有些事情也從這些答案中轉移了出來。 – thelatemail