我有像這樣如何刪除包含Ns個
">ENS..._intronX
acgtacgtacgtacgt
">ENS..._intronY
acgtacgtNNNNa
acgtacgtacgtacgt
">ENS..._intronZ
acgtacgtacgtacgt
acgtacgtacgtacgt
我需要在一排與至少2 N
以除去序列(因爲這些內含子misannotated)一個FASTA文件的fasta格式化的序列。
在此,這將是序列" >ENS..._intronY "
(第3行,圖4和5應被刪除)
任何建議?
謝謝
應該用N +來代替NNNN嗎? –
@BugKiller,嘆氣,'ENS'中的'N'導致所有記錄不符合條件 – iruvar
downvoter,我想這是關於awk不是解析fasta文件的正確工具,但是請解釋 – iruvar