我發佈了這個問題: Non overlapping pattern matching with gap constraint in python;兩個月前。我只得到一個迴應。但解決方案非常長,並且對於模式中的每個單詞,都會形成一個嵌套循環。有什麼辦法遞歸形成下面的函數嗎?在Python中爲嵌套循環創建遞歸函數
i=0
while i < len(pt_dic[pt_split[0]]):
match=False
ii = pt_dic[pt_split[0]][i]
#print "ii=" + str(ii)
# Start loop at next index after ii
j = next(x[0] for x in enumerate(pt_dic[pt_split[1]]) if x[1] > ii)
while j < len(pt_dic[pt_split[1]]) and not match:
jj = pt_dic[pt_split[1]][j]
#print "jj=" + str(jj)
if jj > ii and jj <= ii + 2:
# Start loop at next index after ii
k = next(x[0] for x in enumerate(pt_dic[pt_split[2]]) if x[1] > jj)
while k < len(pt_dic[pt_split[2]]) and not match:
kk = pt_dic[pt_split[2]][k]
#print "kk=" + str(kk)
if kk > jj and kk <= jj + 2:
# Start loop at next index after kk
l = next(x[0] for x in enumerate(pt_dic[pt_split[3]]) if x[1] > kk)
while l < len(pt_dic[pt_split[2]]) and not match:
ll = pt_dic[pt_split[3]][l]
#print "ll=" + str(ll)
if ll > kk and ll <= kk + 2:
print "Match: (" + str(ii) + "," + str(jj) + "," + str(kk) + "," + str(ll) + ")"
# Now that we've found a match, skip indices within that match.
i = next(x[0] for x in enumerate(pt_dic[pt_split[0]]) if x[1] > ll)
i -= 1
match=True
l += 1
k += 1
j += 1
i += 1
編輯:對於那些誰沒有得到上下文:
我想找到總沒有。的出現在序列中的模式的非重疊匹配,其中間隙約束2.
例如, A B C
是使用某種算法找到的模式。我必須找到出現在如A A B B C D E A B C …
這樣的序列中的這個圖案的總數,其中最大間隙約束是2.
最大。在序列中沒有看到間隙,但是在屬於序列中的子串的模式的兩個單詞之間可以看到間隙。例如。 Pat: A B C
和seq: A B D E C B A B A B C D E
。
在這種情況下,A B D E C ...
與A,B和B,C之間允許的最大兩個間隙匹配。接下來我們找到A B A B C
作爲另一個匹配。有趣的是。有兩個匹配,(2個字符b/w A,B和2個字符b/w B,C)。但是,我們只會將它計爲一個,因爲它是重疊匹配。 A B X X X C
無效。
重申發佈你的目標在這裏將是很好的替代標線,即使它只是其他職位的複製粘貼。 – Julien