我想要爲數據框創建子集以包含具有> 1條記錄的主題的所有記錄,並且只將這些主題排除在1條記錄之外。R - 僅包含超過1條記錄的主題的子集數據框
讓我們看看下面的數據框;
mydata <- data.frame(subject_id = factor(c(1,2,3,4,4,5,5,6,6,7,8,9,9,9,10)),
variable = rnorm(15))
下面的代碼給我具有> 1個結果使用複製的對象();
duplicates <- mydata[duplicated(mydata$subject_id),]$subject_id
但我想在我的子集,保留所有記錄用> 1點的記錄每一個主題,所以我嘗試;
mydata[mydata$subject_id==as.factor(duplicates),]
哪個不會返回我期待的結果。
任何想法?
您不需要(也不應該)使用像'as.data.frame(cbind(...))'。只需使用'data.frame(var1 = ...,var2 = ...)'(參見我的編輯你的問題)。這樣,您還可以避免在您的全局環境中創建諸如subject_id和變量之類的許多對象,儘管您只需要它們在data.frame中。 – 2014-11-05 08:42:48