我有一個文件(讓我們稱之爲enrolled_students.txt),我需要在Perl中讀取。該文件每行都有數據,因此需要引用其他文件以獲取更多信息。Perl:並行讀取和處理多個文件
例如,主數據庫將具有名稱和地址。但根據每個人的國籍,我必須參考其他文件(按國家排序)來查找匹配的姓名,國籍和家庭地址。
假設我有100個name_of_country.txt文件,並且在我的enrolled_students.txt中有10,000行。我的問題是:
- 我是否閱讀enrolled_students.txt中的每一行,並解析其他100個文件以查找匹配項?這似乎是一個可怕的方式來處理這些數據。有沒有更快的方法來做到這一點?
- 我可以在並行模式(多線程)下執行此進程嗎?
感謝, 漢斯
*「這似乎是一個可怕的方式來處理這些數據。」*是的。 *「有沒有更快的方法來做到這一點?」*使用數據庫而不是平面文本文件。 – ThisSuitIsBlackNot
原始數據僅作爲txt文件提供,要求僅使用perl。 – Hans
看看['DBD :: SQLite'](https://metacpan.org/pod/DBD::SQLite)。它是獨立的(您不必安裝單獨的數據庫服務器),並且可能比您自己拼湊的任何內容都快得多。當然,你必須首先將初始數據集加載到數據庫中......這些文本文件經常變化嗎? – ThisSuitIsBlackNot