2015-02-11 25 views
0

我想使用bwa mem將序列讀取與hg19引用進行比對,但是我的序列都有一個UMI(唯一分子標識符)。我用umitools像這樣:一起使用bwa mem和umitools

umitools trim --end 5 input.fastq NNNNNN > output.fastq 

這再正常附加我的UMI序列中output.fastq文件名行,但是如果使用BWA MEM對準的時候,我得到的錯誤:

paired reads have different names: "someTitle:UMI_ATGCTC", "someTitle:UMI_CATTAT" 

有沒有辦法同時使用bwa mem和umitools,所以這不會發生?

回答

0

所以這並不完全回答這個問題,而是接近。 umitools不能用於配對結束讀取。我做了什麼來解決這個問題是(上的讀取每側6BP)剪掉我的UMI序列,然後使用followign代碼一致:

sed -i~ '2~4s/^.\{6\}//' file 

地址2~4意味着「開始第2行,每組重複4線」。

s表示替換,^匹配行開始,.匹配任何字符,\{6\}指定長度(「量詞」)。替換字符串爲空(//)。

-i~替換原來的文件,留下附加在文件名後面的~備份。