我有以下行test.fa:如何在Python中跳過匹配模式?
#test.fa
>1
AGAGGGAGCTG
CCTCAGGGCTG
CACTCAGGAAA
TTGGGGCGCTG
AGCATGGGGGG
CAGGAGGGGCC
我需要忽略開頭「>」的線,並連接以下行成一個單一的字符串。但是,下面的腳本不僅會跳過帶有「>」的行,而且還會在連接剩餘的行之前跳過下一行。
#!/usr/bin/env python
import sys
import re
string = ""
with open("test.fa","rt") as f:
for line in f:
if re.match(">",line):
line = f.next()
else:
line = line.rstrip("\n")
string = string + line
print (string)
任何人都可以幫助修復腳本,或建議更好的方法來做到這一點嗎?謝謝 !!
我會看看,感謝何塞 – harsh
但是,我建議使用Biopython [biopython解析FASTA(http://biopython.org/wiki/SeqIO#Sequence_Input) –