0
我有一個大小爲2.5 GB的文本文件,其中包含一些標準已知文件的哈希值。我的任務是在我的文件系統上查找所有文件的散列,並將其與存儲在文本文件中的散列進行比較。如果發現匹配,我需要打印已知的屏幕上,如果沒有找到匹配,那麼我需要在屏幕上打印未知。在Python中以編程方式執行超大文件搜索
因此,該任務的方法非常簡單,但主要問題是該過程涉及的文件非常龐大。
有人可以建議如何以優化的方式完成這項任務。
我應該將包含散列的文本文件導入數據庫。如果是的話,那麼請提供一些可能幫助我完成的鏈接。
其次我可以使用什麼算法進行搜索以加速進程?
我的首選語言是Python。