我是相當新的分叉和我有存儲,我做閱讀的文件夾中超過10,000個文件如下:分叉進程和閱讀文件時需要關注什麼?
#loop over all xFiles in a list of files
try:
f = open(xFile, 'r', encoding="utf8")
#search through file for terms
#do other stuff
except:
#Someone removed the file cannot be found.
print("\tFile no longer exists:", xFile)
f.close()
因爲我的劇本花費大約45分鐘來運行,並且由於性質我正在處理的項目中,有時會移動或刪除我正在搜索的文件列表中的文件。這就是爲什麼我的閱讀被包裝在一個try語句中。
其中插入以下注釋「通過文件搜索術語」,我正在運行數千種模式的算法。我希望在循環前分開我的進程,以便我有兩個具有不同模式集(不同大小)的進程通過同一個文件列表搜索(或讀取)。
我的一些顧慮:
- 如果一個進程正在讀取一個文件和它的子進程試圖讀取文件時,除將執行和搜索算法將不會執行該特定文件。
- 我將無法在兩個進程中同時讀取同一文件。
所以這裏是我提出上下文後的問題,在兩個進程之間分叉進程和讀取相同文件時,我需要關注什麼?
它確實幫助了很多謝謝。 –