2015-07-11 136 views
0

我有一個長列(excel中的9500行),其中有很多基因ID。我想刪除重複項。刪除列中的重複項R

ID 
BXDC2      
BXDC5     
BXDC5      
BZRPL1      
BZRPL1          
C10orf11   
C10orf116         
C10orf119    
C10orf120  
C10orf125   
C10orf125  

我希望得到的結果是:

ID 
BXDC2      
BXDC5          
BZRPL1      
C10orf11   
C10orf116         
C10orf119    
C10orf120  
C10orf125   

任何人可以幫助我的R腳本:-)?

+2

的諷刺類...刪除重複是重複:) – RHertel

回答

4

您可以使用duplicatedunique。在這裏,我假設列名爲「ID」

df1[!duplicated(df1$ID),,drop=FALSE] 

或者

library(data.table)#v1.9.4+ 
    unique(setDT(df1), by='ID')