雖然我已經通過有趣的線程Algorithm: efficient way to remove duplicate integers from an array讀,我一直沒能找到一個滿意的回答我的問題: 我有雙打,這通常是相當小的一維數組(只包含多達三個要素) - 儘管這不一定是一般性的標準。 此外,我不想只找到真正的重複,但重複的意義在於元素的差異低於某個閾值。雖然這個要求相當容易處理,但我的實際
我不是程序員,但我想幫助刪除文檔中的重複行,並只保留原始行。 我試圖用一些文本處理器editpadpro做到這一點,但由於我的文件超過1 GB,總是被凍結,無法完成操作。 我知道perl在這方面非常好,但我不知道如何使用它,請記住該文件可以超過1或2 GB。輸入線 例如:輸出線 line 1
line 2
line 3
line 1
line 2
line 4
line 1
例如: