2015-06-10 55 views
0

劈裂給定長度的子串簡單的方法我有一個34-mer的字符串如從字符串

ATGGGGTTTCCC...CTG 

我希望得到所有可能的6聚物子在此字符串。你能建議一個很好的方法來做到這一點。

+0

相當接近http://stackoverflow.com/questions/21303224/iterate-over-all-pairs-of-consecutive使用切片 - 從一個給定列表,但不是一個確切的愚蠢 –

回答

1

假設他們必須是連續的,你可以在列表解析

>>> s = 'AGTAATGGCGATTGAGGGTCCACTGTCCTGGTAC' 
>>> [s[i:i+6] for i in range(len(s)-5)] 
['AGTAAT', 'GTAATG', 'TAATGG', 'AATGGC', 'ATGGCG', 'TGGCGA', 'GGCGAT', 'GCGATT', 'CGATTG', 'GATTGA', 'ATTGAG', 'TTGAGG', 'TGAGGG', 'GAGGGT', 'AGGGTC', 'GGGTCC', 'GGTCCA', 'GTCCAC', 'TCCACT', 'CCACTG', 'CACTGT', 'ACTGTC', 'CTGTCC', 'TGTCCT', 'GTCCTG', 'TCCTGG', 'CCTGGT', 'CTGGTA', 'TGGTAC']