2014-09-05 52 views
-2

我有一個製表符分隔的文件看起來像這樣:找到一條線的模式和打印線

chr1 28563 . A G 13.0 . DP=3;VDB=3.520000e-02;AF1=1;AC1=2;DP4=0,0,0,2;MQ=25;FQ=-33;EFF=exon_variant(MODIFIER|||n.50+758T>C|WASH7P||NON_CODING|NR_024540.1|1) GT:PL:GQ 1/1:44,6,0:9 
chr1 537678 . T C 35.8 . DP=2;VDB=6.880000e-02;AF1=1;AC1=2;DP4=0,0,0,2;MQ=37;FQ=-33;EFF=intergenic_region(MODIFIER||||||||) GT:PL:GQ 1/1:67,6,0:10 
chr1 537680 . G T 28.8 . DP=2;VDB=6.880000e-02;AF1=1;AC1=2;DP4=0,0,0,2;MQ=37;FQ=-33;EFF=intergenic_region(MODIFIER||||||||) GT:PL:GQ 1/1:60,6,0:10 
chr1 540975 . G A 6.2 . DP=7;VDB=3.422171e-02;RPB=1.053122e+00;AF1=0.5;AC1=1;DP4=2,1,2,1;MQ=19;FQ=7.43;PV4=1,0.34,0.19,1;EFF=intergenic_region(MODIFIER||||||||) GT:PL:GQ 0/1:35,0,39:35 

如果任何行EFF =外顯子,該行應打印。

chr1 28563 . A G 13.0 . DP=3;VDB=3.520000e-02;AF1=1;AC1=2;DP4=0,0,0,2;MQ=25;FQ=-33;EFF=exon_variant(MODIFIER|||n.50+758T>C|WASH7P||NON_CODING|NR_024540.1|1) GT:PL:GQ 1/1:44,6,0:9 

請在bash或perl中使用一行代碼。 謝謝

在我的情況下,該行應打印

+6

'grep的EFF =外顯子file' – 2014-09-05 09:21:42

+1

@ mpapec它應該是一個答案,國際海事組織,正確的路要走。 – Kent 2014-09-05 09:23:32

+1

@請關閉此問題,因爲它有許多重複項。 – 2014-09-05 09:24:58

回答

1

你可以試試awk命令下面,

awk '/EFF=exon/{print}' file 

OR

$ awk '/EFF=exon/' file 
chr1 28563 . A G 13.0 . DP=3;VDB=3.520000e-02;AF1=1;AC1=2;DP4=0,0,0,2;MQ=25;FQ=-33;EFF=exon_variant(MODIFIER|||n.50+758T>C|WASH7P||NON_CODING|NR_024540.1|1) GT:PL:GQ 1/1:44,6,0:9