我有以下格式的一些數據:多列排序
1298501934.311 42.048
1298501934.311 60.096
1298501934.311 64.128
1298501934.311 64.839
1298501944.203 28.352
1298501966.283 6.144
1298501972.900 0
1298501972.939 0
1298501972.943 0
1298501972.960 0
1298501972.961 0
1298501972.964 0
1298501973.964 28.636
1298501974.215 27.52
1298501974.407 25.984
1298501974.527 27.072
1298501974.527 31.168
1298501974.591 30.144
1298501974.591 31.296
1298501974.83 27.605
1298501975.804 28.096
1298501976.271 23.879
1298501978.488 25.472
1298501978.744 25.088
1298501978.808 25.088
1298501978.936 26.24
1298501979.123 26.048
1298501980.470 23.75
1298501980.86 17.53
1298501982.392 22.336
1298501990.199 8.064
1298501997.943 0.256
1298501997.943 0.448
1298501997.943 0.512
1298501997.943 5.952
1298501997.946 0.448
1298501997.946 0.576
1298501997.946 5.44
我的目標是獲得來自右列的最大值在左欄中的每個獨特的價值。例如,處理以下4行後:
1298501997.943 0.256
1298501997.943 0.448
1298501997.943 0.512
1298501997.943 5.952
我希望得到公正的最後一行,
1298501997.943 5.952
因爲
「5.952」 是1298501997.943
最大值同樣,對於以下幾行:
1298501997.946 0.448
1298501997.946 0.576
1298501997.946 5.44
我想要得到:
1298501997.946 5.44
併爲:
1298501990.199 8.064
簡單:
1298501990.199 8.064
等等...
我試圖尋找在AWK/uniq的/等一些提示。但不知道如何制定查詢。 我可以編寫一個Python腳本,但是覺得繼續使用awk或其他標準工具會更有效率(尤其是因爲我有大量數據 - 數百萬/數千萬行)。
PS:有沒有用於這種文本處理場景的任何Python模塊?
謝謝
你有哪些數據?只是在一個文本文件?在數據庫中?你想用什麼來分類?一種特定的編程語言,還是隻是希望將數據(無論它在哪裏)進行排序? – cdeszaq