我目前文件正在與超過200萬線。我已將行分隔爲元素列表(例如:[a,b,c,d]
= 1行,單詞分隔)。Python的循環優化
我嘗試使用下面的代碼要經過所有行:
for a in aud:
for esps in final:
if a[0] in final[esps]:
a[0] = esps
在第一個for循環,我指的是200萬條+線。在第二個for循環中,它通過一個帶有2010鍵的字典,每個鍵可能至少有50個相應的值。我想在等於字典中的值的行中找到a[0]
元素。如果它們匹配,則將所選行中的a[0]
元素更改爲字典的鍵值。
的問題是,這種代碼需要年齡運行,我不明白太多(沒有),有關優化,以及如何以更快的速度運行此。 如果有人能告訴我如何更快地做這樣的事情,我會非常感謝。
嗯,你只限於一臺電腦?我想你可以用幾個工人來做到這一點。即使只使用一臺計算機,也可以使用多核CPU創建多個工作人員 –
在沒有任何示例數據的情況下,要解決您的實際問題有點難。每個「最終」字典字符串中的所有50個密鑰都是? – jsbueno
在迭代它的時候會不會有一個變異對象的副作用? – pylang