從下面的表格中,我想總結第1列中的miRNA具有正值和負值(第3列)的次數,並將其作爲條形圖。查找矩陣中字符串的出現次數
我已經作出這個命令,但隨後對求和值,而不是計數OCCURENCES的:
awk '{x[$1 " " $2]+=$3} END{for (r in x)print r,x[r]}'
例如:
miRNA target value
mmu-miR-423-3p NM_198167 0.7999
mmu-miR-744-5p NM_001166476 0.79927
mmu-miR-423-5p NM_146188 -0.79503
mmu-miR-423-3p NM_172262 -0.79463
mmu-miR-3968 NM_001185020 0.79367
mmu-miR-298-5p NM_175127 0.79357
mmu-miR-423-5p NM_009320 -0.7934
mmu-miR-423-5p NM_015732 0.7928
....
output:
miRNA positive negative
mmu-miR-423-3p 1 1
mmu-miR-423-5p 1 2
使用散列是解決這個問題的慣用方式(在Perl中)。 – TLP 2014-09-03 16:17:56
編輯了一個awk我試圖用 – user3741035 2014-09-03 16:44:08