我在大約50k個文件中尋找800個元素的列表,每個文件大約50行。 (這些是帶有非通用名稱的xml標籤 - 搜索很簡單,因此我沒有使用美麗的湯。)(多少)在檢查2個列表時,首先排序的是多少?
每找到一個元素就會縮短800個元素的列表。
迭代通過文件,
不要緊,我經過第一 - 檢查對所有可能的元素每條線(檢測線的「點」,「流浪者」,「汪汪」,等...)或者一次檢查所有行檢查一個元素(例如,檢查文件中的所有行是否爲「spot」,然後檢查所有行爲「rover」等)。
還是這一切效率低下? (這是使用python) 我在想:
for line in somefile:
for element in somelist:
if re.search(element, line):
....
或:
for element in somelist:
for line in somefile:
if re.search(element, line):
....
要查找的元素是在一個列表中,這是更長的列表(與行相比) - 所以我應該先遍歷它們? – Donnied
@Donnied我澄清了 - 並檢查出kindall的答案 –