我有一個R數據框,由兩列組成:'基因'和'表達'。它有一些基因的重複行,但是這些重複的條目具有不同的表達式值。我想濃縮重複行,因此每個基因只有一行,並且該行具有最大的「絕對」表達式值。請參見下面的例子:有條件地從數據框中刪除重複的行
對於這個數據幀...
df <- data.frame(Gene=c("AKT","MYC","MYC","RAS","RAS","RAS","TP53"),
Expression=c(3,2,6,1,-4,-1,-3))
Gene Expression
1 AKT 3
2 MYC 2
3 MYC 6
4 RAS 1
5 RAS -4
6 RAS -1
7 TP53 -3
我想這個輸出..
Gene Expression
1 AKT 3
2 MYC 6
3 RAS -4
4 TP53 -3
我可以使用識別重複基因
duplicated(df$Gene)
但我不確定如何排除那些重複次數較小的絕對值。
詩 - 我在該R說大話新..
的可能重複的[R,有條件地去除重複行(http://stackoverflow.com/questions/10835284/r-conditionally-remove-duplicate-rows) – 2015-03-13 17:16:10