我想打印匹配的搜索模式,然後計算平均行。最好將是一個expample:在awk中打印搜索模式
輸入文件:
chr17 41275978 41276294 BRCA1_ex02_01 278
chr17 41275978 41276294 BRCA1_ex02_01 279
chr17 41275978 41276294 BRCA1_ex02_01 280
chr17 41275978 41276294 BRCA1_ex02_02 281
chr17 41275978 41276294 BRCA1_ex02_02 282
chr17 41275978 41276294 BRCA1_ex02_03 283
chr17 41275978 41276294 BRCA1_ex02_03 284
chr17 41275978 41276294 BRCA1_ex02_03 285
chr17 41275978 41276294 BRCA1_ex02_04 286
chr17 41275978 41276294 BRCA1_ex02_04 287
chr17 41275978 41276294 BRCA1_ex02_04 288
我在bash循環(例如)一樣的第四列瓦納提取物:
OUTPUT1:
chr17 41275978 41276294 BRCA1_ex02_01 278
chr17 41275978 41276294 BRCA1_ex02_01 279
chr17 41275978 41276294 BRCA1_ex02_01 280
OUTPUT2 :
chr17 41275978 41276294 BRCA1_ex02_02 281
chr17 41275978 41276294 BRCA1_ex02_02 282
OUTPUT3:
chr17 41275978 41276294 BRCA1_ex02_03 283
chr17 41275978 41276294 BRCA1_ex02_03 284
chr17 41275978 41276294 BRCA1_ex02_03 285
的等等。然後計算平均爲第五列是很容易的:
AWK 'END {總和+ = $ 5} {打印NR /總和}' in_file.txt
在我的情況下,有數千行BRCA1_exXX_XX - 所以任何想法熱分裂它?
Paul。
這假設條目總是按順序排列的。 –
Wau它看起來可以工作:-)謝謝!有可能解釋嗎?我可以添加到第三列標準偏差值嗎? – Geroge
@EtanReisner是的,它假定條目按第4列排序,如給定數據中所示。 – ooga