我試圖編寫一個需要輸出爲矩陣的代碼,但由於是新手,我沒有正確理解它。基本上我想爲每列的A,C,G,T生成一個計數矩陣。我能夠做到這一點,但很難爲其他專欄做。如何在python中填充矩陣
輸入文件
>Rosalind_1
ATCCAGCT
>Rosalind_2
GGGCAACT
>Rosalind_3
ATGGATCT
>Rosalind_4
AAGCAACC
>Rosalind_5
TTGGAACT
>Rosalind_6
ATGCCATT
>Rosalind_7
ATGGCACT
到目前爲止我的代碼
fh_in = open("consensus_seq.txt", 'r')
A_count = 0
C_count = 0
G_count = 0
T_count = 0
result = []
for line in fh_in:
line = line.strip()
if not line.startswith(">"):
for nuc in line[0]:
if nuc == "A":
A_count += 1
if nuc == "C":
C_count += 1
if nuc == "G":
G_count += 1
if nuc == "T":
T_count += 1
result.append(A_count)
result.append(C_count)
result.append(G_count)
result.append(T_count)
print result
輸出
[5, 0, 1, 1]
我想要的實際產量
A 5 1 0 0 5 5 0 0
C 0 0 1 4 2 0 6 1
G 1 1 6 3 0 1 0 0
T 1 5 0 0 0 1 1 6
任何幫助/提示表示讚賞。
這是如此簡單。謝謝.... – upendra 2014-11-07 20:20:27