我一直在試圖打印最頻繁的行,並刪除重複值的關鍵值分隔標籤在第一個字段中有很多不同的值的大文件;打印最頻繁的行並刪除重複項
例如輸入:
a|gofortheeyeboo 0.61
a|gofortheeyeboo 0.81
a|gofortheeyeboo 0.81
a|gofortheeyeboo 0.81
a|gofortheeyeboo 0.81
a|gofortheeyeboo 0.81
a|gofortheeyeboo 0.91
a|gofortheeyeboo-gone 0.07
a|gofortheeyeboo-gone 0.07
a|gofortheeyeboo-abouttogone 0.61
a|gofortheeyeboo-abouttogone 0.12
b|attaack-attack 0.07
爲不同的密鑰所需的輸出:
a|gofortheeyeboo 0.81
a|gofortheeyeboo-gone 0.07
a|gofortheeyeboo-abouttogone 0.61
a|gofortheeyeboo-abouttogone 0.12
b|attaack-attack 0.07
到目前爲止,所管理的獲得在第二製表符分隔的字段通過刪除重複最大值輸出;
awk -F '\t' '{ if (l[$1] <= $2) l[$1] = $2} END {for (i in l) print i"\t"l[i];}'
以上命令的輸出是不需要的;
a|gofortheeyeboo 0.91
a|gofortheeyeboo-abouttogone 0.61
b|attaack-attack 0.07
a|gofortheeyeboo-gone 0.07
關於嘗試'uniq'和'head'什麼? – squiguy
這是一個很大的文本文件。不幸的是不是關於噓聲。 – gulahgula