-1
我必須修改以下代碼以查找允許每三個鹼基(一個核苷酸)不匹配的所有100-mers(100個核苷酸的塊)。任何關於如何解決這個問題的邏輯將不勝感激。謝謝!有限制的散列序列
# length of hash key kmerlen = 30 # hash table for finding hits lookup = defaultdict(list) # store sequence hashes in hash table print("hashing seq1...") for i in xrange(len(seq1) - kmerlen + 1): key = seq1[i:i+kmerlen] lookup[key].append(i) # look up hashes in hash table print("hashing seq2...") hits = [] for i in xrange(len(seq2) - kmerlen + 1): key = seq2[i:i+kmerlen] # store hits to hits list for hit in lookup.get(key, []): hits.append((i, hit)) # hits should be a list of tuples # [(index1_in_seq2, index1_in_seq1), # (index2_in_seq2, index2_in_seq1), # ...]
這個程序是什麼?什麼是「mer」?什麼是「基地」?意識到我們不知道這項任務是什麼。 –