假設我的數據框(mydata)中有三個變量:1)id,2)大小寫和3)值。刪除每個ID的重複項
mydata <- data.frame(id=c(1,1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4), case=c("a","b","c","c","b","a","b","c","c","a","b","c","c","a","b","c","a"), value=c(1,34,56,23,34,546,34,67,23,65,23,65,23,87,34,321,87))
mydata
id case value
1 1 a 1
2 1 b 34
3 1 c 56
4 1 c 23
5 1 b 34
6 2 a 546
7 2 b 34
8 2 c 67
9 2 c 23
10 3 a 65
11 3 b 23
12 3 c 65
13 3 c 23
14 4 a 87
15 4 b 34
16 4 c 321
17 4 a 87
對於每個id,我們可以有類似的'case'字符,它們的值可以相同或不同。所以基本上,如果它們的值相同,我只需要保留一個並刪除重複。
我的最終數據,然後將
id case value
1 1 a 1
2 1 b 34
3 1 c 56
4 1 c 23
5 2 a 546
6 2 b 34
7 2 c 67
8 2 c 23
9 3 a 65
10 3 b 23
11 3 c 65
12 3 c 23
13 4 a 87
14 4 b 34
15 4 c 321
我會的,但也有數據集中其他變量和它們的值可能是不同的..所以我只需要調整案例和價值。 – user9292 2014-12-02 17:16:07
@ user9292您可以對三個變量的數據集進行子集歸類。即。 'mydata [!重複(mydata [,c('id','case','value')]),]' – akrun 2014-12-02 17:17:18