我想查找「參考」列的重複值,然後保留僅複製來自「金額」列的最大金額列的找到的行。如何合併具有重複值的列並保留Python中不同列的最大值?
電流:
+----------+---------------------+---------+
| reference | amount | column3 | column4 |
+----------+---------------------+---------+
| test1 | 9 | 45 | ye |
| test1 | 200| 45 | agag |
| test1 | 1 | 45 | aaa |
| test2 | 99 | 45 | bbab |
| test1 | 11 | 45 | value |
+----------+---------------------+----------+
期望:
+----------+---------------------+---------+
| reference | amount | column3 | column4 |
+----------+---------------------+---------+
| test1 | 200| 45 | agag |
| test2 | 99 | 45 | bbab |
請分享對這種情況的線索。
什麼你的數據格式和你到目前爲止做了什麼? – Kasramvd
請告知您正在使用哪種數據類型。你基本上可以使用group by,並從每個組中找到最大值。 – vdkotian
這是一個csv文件。我試圖找到重複的行。我會繼續挖 – serte