2015-12-08 70 views
0

我有這樣的事情:xargs的和衛生間-c

grep -v ">" $subfolder/assembly/contigs_1L.fasta | xargs -d \n wc >> $subfolder/N50_analysis/NC_len.txt 

有了這個,我想,從FASTA文件,刪除的標識,然後我想計算每一行該行的字符。

xargs做它應該在\ n後分裂,但它不會計數。如果我在沒有\ n的情況下做到這一點,那麼每件事都只在一條大線上。

編輯:

輸入

>C1 
AGATGATGAGGATGAGATTGACTACGATCGATCGATGCATCGATCGGCATCGATCGACTGATCGATCGATCGATCGATCGATCGTACGATCGGCTACGCGCGATCGACGCGCGCGATCGATCGATCGTCGATCGGCGCGCTACGATCG 

>C2 
AGATGATGAGGATGAGATTGACTACGATCGATCGATGCATCGATCGGCATCGATCGACTGATCGATCGATCGATCGATCGATCGTACGATCGGCTACGCGCGATCGACGCGCGCGATCGATCGATCGTCGATCGGCGCGCTACGATCG 

我只需要AGCT的序列的長度,所以我考慮不以啓動(grep的)一切>,在文件中。然後,我想單獨計算每個序列的長度,所以在最後我得到的是這樣的:

150 
100 
    . 
    . 
    . 
    Cn 
+1

如果您向我們展示了您的輸入樣本以及所需的輸出,它將會更容易幫助您。 –

回答

0
grep -v ">" testfile | awk '{ print length }' >> charcount.txt 

可能是你在找什麼。