我有一個文件,有很多的字母序列。
其中一些序列可能是相同的,所以我想比較一下。
我在做這樣的事情,但是這不正是想我想要的東西:文件的比較文件內部字母序列的最佳方法?
for line in fl:
line = line.split()
for elem in line:
if '>' in elem:
pass
else:
for el in line:
if elem == el:
print elem, el
例如:
>1
GTCGTCGAAGCATGCCGGGCCCGCTTCGTGTTCGCTGATA
>2
GTCGTCGAAAGAGGTCT-GACCGCTTCGCGCCCGCTGGTA
>3
GTCGTCGAAAGAGGCTT-GCCCGCCACGCGCCCGCTGATA
>4
GTCGTCGAAAGAGGCTT-GCCCGCTACGCGCCCCCTGATA
>5
GTCGTCGAAAGAGGTCT-GACCGCTTCGCGCCCGCTGGTA
>6
GTCGTCGAAAGAGTCTGACCGCTTCTCGCCCGCTGATACG
>7
GTCGTCGAAAGAGGTCT-GACCGCTTCTCGCCCGCTGATA
所以我想什麼,如果已知如果任何序列完全等於1,或等於2,依此類推。
(1)每行有多少個序列? (2)您是否試圖查找一行中的序列是否與同一行中的其他序列匹配,或者行中的序列是否與同一文件中的其他序列匹配? (3)你可以發佈一些樣本行嗎? – 2010-09-09 11:03:29
你想比較多少個序列? – 2010-09-09 11:13:35
你只需要知道有匹配,還是你需要的位置呢? – 2010-09-09 11:14:05