我寫了一個perl腳本,它讀取2個不同的文件,比較這兩個文件中的ID並僅打印ID匹配的數據。 ID文件被讀入一個數組,而數據文件被逐行讀取。這一切都工作得很好,但現在我需要添加更多。在我的數據文件中,有時候我會有行重複的ID,因爲主題已經有多次訪問提供樣本。因此,我需要查找這些重複項目,並只採取最新的訪問日期。搜索特定的重複ID的
所以我的數據文件看起來是這樣的:
ID DOV Data1 Data2 etc etc
現在,我已經看到了哈希值是搜索重複的方式,但所有我見過一直簡單地胡亂刪除重複的修復,這不是我想要的。
任何想法?
閱讀所有行到哈希由ID,覆蓋任何以前的值。如果輸入未按DOV排序,則需要添加比較,並且只有在新值更新時才進行替換。然後在最後打印出散列。 (假設「DOV」代表「訪問日期」。) – tripleee 2012-07-09 11:41:20
@tripleee您是指將整個文件一次讀入散列或逐行讀取?我從來沒有使用過散列,所以如果你能給出一個你的意思很好的例子! – Michelle 2012-07-09 13:04:30