2016-01-14 41 views
1

我想總結一下每行的整數。我有一個數據文件,用於提取信息。總結殼數

我使用此命令提取第10列中具有大於0.25的值的第7個信息。我希望得到總數超過0.25的整數。但我發現了這是我現在越來越多0.25

awk -F"\t" 'NR>1{split($10,a,":"); count10[a[7]]++} END {for (i in count10) if (i>0.25) print i, count10[i]}' mygene.vcf 

樣本輸出整數列表:

0.689 7 
0.648 9 
0.607 83 
0.279 26 

什麼我需要:

125 

樣本數據(第10欄)

1/1:27:0,27:0,37:0:0,0.741:1.0:0:98:0,59.0 
1/0:26:15,11:35,37:0:0.733,0.727:0.423:0:28:56.9,60.0 
1/1:55:0,55:0,38:0:0,0.527:1.0:0:183:0,59.6 
1/0:49:26,23:36,36:0:0.615,0.739:0.469:0:47:60.0,58.5 
+2

您能否提供一些樣本數據? –

回答

1

你基本上已經擁有了它。不要爲for循環的每次迭代打印一張圖,而要累積並打印:

awk -F"\t" 'NR>1 {split($10,a,":"); 
        count10[a[7]]++} 
      END {for (i in count10) 
        if (i>0.25) 
         sum += count10[i]; 
        print sum }' mygene.vcf