我有一個非常大的數據集,它看起來像下面這樣: df <- data.frame(school=c("a", "a", "a", "b","b","c","c","c"), year=c(3,3,1,4,2,4,3,1), GPA=c(4,4,4,3,3,3,2,2))
刪除重複任何幫助將是巨大的
school year GPA
a 3 4
a 3 4
a 1 4
b 4 3
b 2 3
c 4 3
c 3 2
c 1 2
,我希望它看起來像:
school year GPA
a 3 4
a 3 4
b 4 3
c 4 3
所以基本上,我想要的是每個給定的學校,我希望他們的高年級學生(學生),不管GPA。
我曾嘗試:
new_df <- df[!duplicated(paste(df[,1],df[,2])),]
但是這給了我的學校和年之間的獨特組合。
,而下面的人給我的唯一學校 new_df2 <- df[!duplicated(df$school),]
任何幫助將是巨大的,謝謝大家!
謝謝你這麼多ttmaccer,我解決了我的問題! :P – user1489597 2012-08-14 03:15:28