0
在包含.txt的zipFile中搜索行的最快方法是什麼?快速查找zipfile中沒有內存的行
zipfile的大小約爲100MB,提取後大約700MB,所以我不能提取和讀取內存中的文本文件。
是否有任何可以讀取內存(100 MB)中的zipfile並進行搜索的可能性?
目前我做。
with ZipFile(zip_file) as myzip:
with myzip.open(myzip.namelist()[0]) as myfile:
for line in myfile:
if line.startswith("interesting words"):
print(line)
需要大約15秒。
我想['re.finditer'](https://docs.python.org/2/library/re.html#re.finditer)可能會加快速度,但不知道 –
text = myfile。讀()而不打內存?它的700MB文件insize zip。我只能讀取大小爲zip文件的100 MB而不是未壓縮的文本。感謝您指出。 – Rahul
當然,它使用了大量的內存,但即使使用Python的開銷,一個700 MB的字符串可能不會超過您的計算機可以處理的數量。這段代碼試圖交換內存使用的速度(雖然我不知道你會看到實際速度有多快)。如果您確實需要儘量減少內存使用量,同時仍然使用簡單的代碼,則您現有的代碼大致如此。 – Blckknght