2014-04-05 92 views
1

我有23000行8列一個子集數據框

一個數據幀我想只用唯一標識符是在第1列我這樣做的,

total_res2 <- unique(total_res['Entrez.ID']); 

這將產生17,000至其子集行只有第1列的信息。

我想知道如何提取基於此列的唯一行,並從其他7列中僅使用這些唯一行獲取信息。

回答

1

這返回的total_res包含每個Entrez.ID值的第一個出現的行:

subset(total_res, ! duplicated(Entrez.ID)) 

還是你的意思是你只需要行其Entrez.ID不重複:

subset(total_res, ave(seq_along(Entrez.ID), Entrez.ID, FUN = length) == 1) 

下一次請提供測試數據和預期輸出。

+0

非常感謝,完美的工作! – user3294511