我有一個主要由重複行組成的數據集(data.frame)。我想對它進行子集化處理,以便只獲得最初沒有重複的行。原DF的例子:不重複的子集行
df1 <- data.frame(ID = c("1", "1","2","2","3","3","4","4"), V_1 = c(2011,2011,NA,NA,1,10,7,7), V_2= c(5,5,6,6,15,15,8,2))
回答我倒是想了解:
df2 <- data.frame(ID = c("3","3","4","4"), V_1 = c(1,10,7,7), V_2= c(15,15,8,2))
使用unique(df1)
功能給了我唯一行的完整列表(在本例的情況下,6)。由於我的DF有超過20萬行,這對我來說是不夠的。
我已搜索類似的問題: Subset with unique cases, based on multiple columns,Filter rows based on multiple column conditions R,但他們都沒有幫助我。