-1
我有兩個文件f1.fasta
和f2.fasta
。我想比較f1
和f2
中的序列,但也可以得到核苷酸不同的位置,以便我可以替換它們。比較兩個FASTA文件以使用字典獲得差異的位置
f1
FASTA
:
例f2
FASTA
>VFG0127
ATGCCTGGAAATATA...
>VFG0007
TTAGGCATATTTCAT...
:
>VFG0127
ATGCCTGGXXXTATA...
>VFG0007
TTAJGCATATSTCAT...
我想獲得,例如:VFG0127 |位置7,X應該是A ...
我試過這段代碼,但我沒有去任何地方
dict_1 = {}
dict_2 = {}
with open(f1, 'r') as f1, open (f2, 'r') as f2:
for line in f1:
if line.startswith('>'):
id_acc1 = line.strip()
seq_1 = f1.next().strip()
dict_1[id_acc1]=seq_1
#print dict_1
for line in f2:
if line.startswith('>'):
id_acc2 = line.strip()
seq_2 = f2.next().strip()
dict_2[id_acc2]=seq_2
#print dict_2
diffkeys = [k for k in dict_1.values()[index] if dict_1[k] != dict_2[k]]
for k in diffkeys:
print k, ':', dict_1[k], '->', dict_2[k]
我在這個問題上花了數小時,我無法使它工作。 請我仍然是一個初學者,一個簡單的代碼將不勝感激。
請再看看*「.. f1.fasta:」*的輸入,直到*「...我想要」*。這對我沒有意義 –