目前我有一個比較兩個表的要求,每個表有700M +左右的記錄。使用Perl比較2個文件
根據我們的數據庫性能,我們想出了一個基於文件進行比較的想法,而不是將它帶到數據庫。還聽說Perl比任何其他編碼方法都快得多
我們需要將一個文件中的使用計劃與另一個文件中的相同移動數字進行比較,如果存在且其用法匹配或不匹配,我們需要在新文件中只寫入不匹配的記錄。
實施例:
文件1
number, Usage type , Usage Plan , Usage Volume (KB) ........
12344 , CP , FB , 100 ........
12323 , UP , FB , 200 ........
12322 , CP , G+ , 300 ........
文件2
number, Usage type , Usage Plan , Usage Volume (KB) ........
12344 , CP , FB , 100 ........
12323 , UP , FB , 210 ........
因此,在上述情況下我UNMATCH文件應包含
UNMATCH文件
12323 , UP , FB , 210 ........
12322 , CP , G+ , 300 ........
........
意思是在這之後有很多列,我們不會用它來比較。它們更像是有關該計劃的更多細節。
請在此分享您的建議和編碼想法。
我們的目標是要完成6中的比較 - 7小時..所以那個負荷和其他的東西可以在2天內完成..
在此先感謝.. 山姆
你試過了什麼?另外,文件1中的每行都保證存在於文件2中?每個文件中的記錄是否以相同的順序? – daotoad
它不保證它會存在,也不會按排序順序。 – user2769015
您似乎忘記了指定遇到了什麼問題。 – ikegami