我需要遍歷數百萬次的兩個文件, 統計整個文件中單詞對出現的次數。 (爲了打造的兩個詞列聯表來計算費希爾精確檢驗得分)Python:通過文件快速迭代
我目前使用
from itertools import izip
src=tuple(open('src.txt','r'))
tgt=tuple(open('tgt.txt','r'))
w1count=0
w2count=0
w1='someword'
w2='anotherword'
for x,y in izip(src,tgt):
if w1 in x:
w1count+=1
if w2 in y:
w2count+=1
.....
雖然這是不壞,我想知道是否有任何更快的方法遍歷兩個文件,希望顯着更快。
我很感謝你的幫助。
您需要提供更多信息。請澄清您的具體問題或添加更多的細節,以確切地突出你所需要的。正如目前所寫,很難確切地說出你在問什麼。 –
@InbarRose我添加了更多信息。請讓我知道如果它仍然不夠:) – ytrewq
那麼,仍然有很多信息丟失。你在這裏顯示的任何代碼中使用的任何變量,你應該顯示聲明,例如:什麼是src,tgt,w1,w2,w1count和w2count? –