可以至少核苷酸使用此模式爲4:
(?=(([ACTG]{4,}).*\2))
但是你可以選擇你想要的號碼或固定數量,例如(?=(([ACTG]{5}).*\2))
爲例在Python:
import re
print re.findall(r'(?=(([ACTG]{4,}).*\2))', 'GACATCGGTAACGCATGAATTGTCAGGGTACGCACTGACATGATCGGTTACGAAAGTCAC')
結果:
[('GACATCGGTAACGCATGAATTGTCAGGGTACGCACTGACAT', 'GACAT'),
('ACATCGGTAACGCATGAATTGTCAGGGTACGCACTGACAT', 'ACAT'),
('ATCGGTAACGCATGAATTGTCAGGGTACGCACTGACATGATCGGT', 'ATCGGT'),
('TCGGTAACGCATGAATTGTCAGGGTACGCACTGACATGATCGGT', 'TCGGT'),
('CGGTAACGCATGAATTGTCAGGGTACGCACTGACATGATCGGT', 'CGGT'),
('GGTAACGCATGAATTGTCAGGGTA', 'GGTA'),
('ACGCATGAATTGTCAGGGTACGCA', 'ACGCA'),
('CGCATGAATTGTCAGGGTACGCA', 'CGCA'),
('CATGAATTGTCAGGGTACGCACTGACATGA', 'CATGA'),
('ATGAATTGTCAGGGTACGCACTGACATGA', 'ATGA'),
('GTCAGGGTACGCACTGACATGATCGGTTACGAAAGTCA', 'GTCA'),
('TACGCACTGACATGATCGGTTACG', 'TACG')]`