我需要掃描一個目錄,其中包含具有結構化部分(我想要掃描的)和非結構化部分(我不想掃描)的數百或GB數據。Python os.walk複雜目錄標準
閱讀os.walk函數,我發現我可以使用一組條件來排除或包含某些目錄名稱或模式。
對於這個特定的掃描,我需要添加特定的包含/排除每一級的標準目錄中的,例如:
在根目錄下,設想有兩種有用的目錄,「風向A」和「風向B'和一個無用的垃圾目錄'垃圾'。在方向A中有兩個有用的子目錄'Subdir A1'和'Subdir A2'以及一個無用的'SubdirA Trash'目錄,然後在方向B中有兩個有用的子目錄Subdir B1和Subdir B2加上一個無用的'SubdirB Trash'子目錄。會是這個樣子:
我需要爲每個級別一個具體的標準列表中,這樣的事情:
level1DirectoryCriteria =集( 「目錄A」, 「迪爾B」 )
level2DirectoryCriteria =集( 「子目錄A1」, 「A2子目錄」, 「子目錄 B1」, 「B2子目錄」)
我認爲這樣做的唯一方式顯然是非pythonic使用複雜和冗長的代碼與很多變量和高風險的不穩定。有沒有人有任何想法如何解決這個問題?如果成功,它可以一次保存幾個小時的代碼運行時間。
這看起來promising-我想出來,並會回來給你。 – user3535074
解決方案來自於此! – user3535074