我一直在嘗試調整我的python函數來計算字母組而不是單個字母,而且我遇到了一些麻煩。這是我要算單個字母代碼:在一個字符串中計數多個字母組(蟒蛇)
my_seq = "CTAAAGTCAACCTTCGGTTGACCTTGAAAGGGCCTTGGGAACCTTCGGTTGACCTTGAGGGTTCCCTAAGGGTT"
def count_letters(str):
counts = {}
for c in str:
if c in counts:
counts[c]+=1
else:
counts[c]=1
return counts
counts = count_letters(my_seq)
print(counts)
功能目前吐出來計數爲每個字母。現在它打印此:
{'C': 23, 'T': 30, 'G': 30, 'A': 20}
理想情況下,我想它來打印這樣的:
{'CTA': 2, 'TAG': 3, 'CGC': 1, 'GAG': 2 ... }
我很新的蟒蛇,這被證明是困難的。
謝謝!
你想爲它計算的單詞列表在哪裏? –
@IronFist我只想計算所有3個字母的組。有沒有辦法讓代碼做到這一點,而不需要定義特定的組? – jarch