我有一個包含多列(17)的data.frame。 第2列具有相同的值的若干行,我想保持只有那些行中的一個,具體地,其具有在柱17如何在列A中創建一個唯一的R,並在列B中保留具有最大值的行
最大值例如一個:
A B
'a' 1
'a' 2
'a' 3
'b' 5
'b' 200
Would return
A B
'a' 3
'b' 200
(加上其餘的列)
到目前爲止,我一直在使用獨特的功能,但我認爲它隨機保留一個或只保留第一個出現。
**更新** 真實數據有376000行。我已經嘗試過data.table和ddply的建議,但他們需要永遠。任何想法是最有效的?使用包data.table
做'tapply'或'plyr'搜索,你會發現很多,許多相同的問題。 – Andrie
關於更新:您需要提供更多信息。我已經用10M行和26組測試了data.table解決方案,性能令人滿意。 – Roland
我正在測試提供的第一個解決方案。 Roland最近的更新需要幾分鐘的時間。 謝謝! – biojl