我正在讀取文件中的行,然後遍歷循環中的每個重疊的k大小的子字符串,然後處理這些字符串。什麼會更好(更高效和優雅)的方式來讀取子字符串?如何在沒有循環的情況下創建列表?更好的方式來讀取文本的子字符串沒有循環/ python
for line in lines[1::4]:
startIdx = 0
while startIdx + k <= len(line):
substring = line[startIdx:(startIdx+k)]
countFromSb[substring] = countFromSb.get(substring, 0) + 1
startIdx += 1
linesProcessed += 1
你想做什麼?如何正則表達式? –
您的解決方案是否正常工作?如果是的話爲什麼你想要不同的東西? – wwii
@wwii只是想讓它更有效率。我需要對同一個文本進行更多的掃描來遍歷子字符串。高效的意思是更快/不需要相同的計算一遍又一遍/不保持內存中的大數據結構 – dusa