tiny_reads = [
Sequence('CGTGCAA'),
Sequence('TGCAATG'),
Sequence('ATGGCGT'),
Sequence('GGCGTGC'),
Sequence('CAATGGC'),]
dictionary = {}
def kmers(reads, k):
for line in tiny_reads:
for kmer in line.iter_kmers(k, overlap=3):
dictionary[str(kmer)] = 1
print(dictionary)
if str(kmer) not in dictionary:
dictionary[str(kmer)] = 1
else:
dictionary[str(kmer)] += 1
#print(dict)
kmers(tiny_reads, 3)
print(dictionary)
我的代碼遍歷上面的序列,並使用iter_kmer()將序列分解爲大小爲3的小讀取('CGT')。我想創建一個字典,它將包含所有這些小讀數以及它們在序列中的數量。我得到的結果是關閉的,我不知道爲什麼。當在字典python中找到密鑰時更新值
預期結果:
k鏈節(tiny_reads,3) { 'AAT':2, 'ATG':3,... 'TGG':2}
我的結果: {」 CAA':2'GTG':2'GCA':2'GCG':2'ATG':2'TGC':2'CGT':2'AAT':2'GGC' :2,'TGG':2}
我的結果不正確,因爲'ATG'重複了3次。你們能否幫助我讓這讓人沮喪?
非常感謝你的工作 – Mufassa