我是一個完整的Python noob,所以請原諒我簡單的問題。我正在嘗試編寫一個腳本,它將查找與ATxxxCA,ATxxxxCA,ATxxxxxCA或ATxxxxxxCA匹配的大字符串中的所有序列,其中x可以是任何字符。當ATxxxCA模式匹配時,我會希望腳本捕獲匹配ATxxxCA周圍的前10個和後10個字符。例如,結果可能是這樣的:aaaaaaaaaaATxxxCAbbbbbbbbbbpython len函數問題
我試圖做這樣開始的腳本:
SeqMatch = input("enter DNA sequence to search: ")
for s in re.findall(r'AT(.*?)CA', SeqMatch):
if len(s) is < 10:
print(s)
else:
print('no sequence matches')
我好像做錯了什麼,我如果循環?誰能幫忙?提前致謝!
我不得不指出BioPython - http://biopython.org/ DIST/docs/tutorial/Tutorial.html#htoc16 – 2011-04-15 22:08:39
執行時會發生什麼?你期望發生什麼? – Bittrance 2011-04-15 22:08:53
不得不指出正則表達式: http://regexpal.com/ 很適合開發/調試正則表達式 – 2011-04-15 22:17:55