我想知道是否有任何有效的方法來逐行比較兩個大文件。逐行比較兩個大文件
文件1
2
3
2
文件2
2 | haha
3 | hoho
4 | hehe
我只是把每個文件的第一個字符,對他們進行比較。目前我正在使用一個非常天真的方法在double for循環中遍歷它們。
像
For i in file 1:
line number = 0
For j in file 2:
loop until line number == counter else add 1 to line number
Compare line 1
increase counter
既讀取文件到內存是不是一種選擇。我在Linux上使用蟒蛇,但我開放給bash的解決方案和Python腳本解決方案
所以,你想比較每行與*相同的行*從另一個文件? '拉鍊'他們! – jonrsharpe
@Jornsharpe我無法壓縮它們,因爲我無法將它們加載到內存中 – aceminer
如果你使用2.x,'itertools.izip'它們 – jonrsharpe