如何才能對以下示例數據框進行子集化,以僅返回最早發生的一個 觀察[即分(年)]每個ID?子集R數據框或有關重複變量的值
id <- c("A", "A", "C", "D", "E", "F")
year <- c(2000, 2001, 2001, 2002, 2003, 2004)
qty <- c(100, 300, 100, 200, 100, 500)
df=data.frame(year, qty, id)
在上面的例子中有在2000年和2001年在重複的ID的情況下,兩個意見爲「A」的ID,我想該子集的數據幀僅包括第一次出現(即在2000年)重複的id的觀察。
df2 = subset(df, ???)
這就是我試圖返回:
df2
year qty id
2000 100 A
2001 100 C
2002 200 D
2003 100 E
2004 500 F
任何援助將不勝感激。
非常直觀的解決方案。非常感謝你。 – MikeTP