我有一個包含約20000行數據的CSV文件。 我需要比較/準確找出eacy陣列重複自我的次數,結果按從高到低排序。如何比較數組並查找以ruby排序的匹配數
例
a[0000001] = [23.2 ,54 ,87.9 ,34 ,8]
a[0000002] = [3.2 ,4.9 ,8.7 ,54.3 ,98]
a[0000003] = [2.32 ,24 ,37.9 ,32 ,8.7]
a[0000004] = [22.2 ,54 ,72.1 ,3.4 ,8.8]
等等等等
我試圖找到每個陣列到底有多少次可以說例如[0000001] = [23.2,54,87.9,34, 8]在整個數據中重複了自己。 數組需要按照從高到低的順序進行排序,並且還需要將排序數量從高到低排序。
如果我僞代碼來描述所需要的
a1 = [1,2]
a2 = [1,4]
a3 = [1,5]
a4 = [1,2]
a5 = [1,4]
a6 = [1,4] ...........
a20000[1,8]
for each a# (a1 for example)
compare a# with a.all
a1occuredindata = 2
go to next a# (a2 for example)
compare a# with a.all
a2occuredindata = 3 ..... until a20000
in the end
sort
a2 occured highest number of time = 3 followed by
a1 = 2 so on so forth
我不太明白;你能否編輯這個問題來澄清?這個問題提到了CSV,但隨後切換到了數組(或者顯然是一個數組數組)。您顯示的數據與CSV有什麼關係?另外,當你說「從高到低排序」時,你能解釋一下什麼使陣列比另一個更高?同時查看輸入數據和預期輸出會很有幫助。 –
對此感到抱歉。請不要提及CSV。我有示例中給出的數組,其中大約有20,000個。 – user2716736
這樣比較好。這個問題仍然可以用一些改進,但現在我認爲它不需要擱置。感謝您改進您的問題。 –