我試圖寫下面的程序的切片的行和列遞增:由1
import numpy as np #import package for scientific computing
dna1 = str(np.load('dna1.npy'))
def count(dna1, repeat):
i = 0
for s in range(len(dna1)):
if (s =='repeat'):
i += 1
s += dna1[0:1]
return i
repeat = 'TTTT'
n = count(dna1, repeat)
print ('{repeat} occurs {n} times in dna1'.format(repeat=repeat, n=n))
我想提取的4個字母每一個可能的組合列表,檢查它們是否相等'TTTT'
。但我不知道如何遞增,以便在列表中移動1位,但仍然讀取4個字母。
你能顯示你的數據集摘錄嗎?很難確切地知道如何在不知道結構的情況下做出循環。 – rumdrums
當然! DNA1 =「TAGCAGAAGTTGTCTCATGGACTGTATAACTCTTGCTACGCTTATTACTTTCAAACCTCCTTTGGAATGTATTTGGGCTCTAAAAATCGCCCTGAGTGACTCCAGTATATCAATTTACTCTGTTTGTCATATCTGCAGACTTGCAATACTATTCAAGCTGATAATAGAAAGTAGGGGCTATAACGACTTTTCTCACCACTGACATTGTACCCTAGTATTCAATACTAATAGGTCCGCTATATTAGATCTAAAATGCATATT ......」它的推移和 – Hotaru
首先,必須有一些Python匹配功能,谷歌「正則表達式匹配功能蟒」,其次,在psudo碼我會做:循環整個字符串,對於str [i]中的每個字母,匹配子字符串i..i + 3和「TTTT」。 – shinzou