-2
我有以下任務,我想知道如何在Perl中最有效地解決這個問題。 首先,我有66個元素的數組(染色體:開始:結束),看起來像這樣從文本文件中篩選符合Perl中任何數組元素的行
my @array = qw(chr1:1566-1762 chr7:1695-1955 ....)
接着我有一個大小爲50MB的包含該
CHR \t START \t \END \tab \Pattern
chr1 \t 1757 \t \2354 \t XM:Z:......H..H....H
.
.
我想要一個文件檢查我的文件的每一行,是否位置,開始和結束符合我的數組中的任何元素。文件中的讀取位置與我的數組中的位置不同,但是開始位置應該包含在範圍內。因此,例如,我有一個適合第一個元素「chr1:1566-1662」的起始位置爲1757的讀數。
您會採取什麼方法?我很高興每一個提示和想法!
因此,如果我理解得很好,您只需要考慮CHR列和START列?你可以編輯你的問題,並添加更多的數據進行一些測試。 – 2014-10-09 14:39:40
您的文件是否實際在每個字段之間包含文字字符'\ t',或者您只是試圖表明它是製表符分隔的? – ThisSuitIsBlackNot 2014-10-09 14:39:45
它是製表符分隔! – user3401516 2014-10-09 19:59:43