我有一個文件input.txt,在bash中使用sed,awk或shell腳本如何獲得列中唯一不同的字符串數量?bash - 在文件列中找到不同的字符串
例如:
# cat input.txt
878933fa4965c31c88ee8696a1a5838f abc xyz
878933fa4965c31c88ee8696a1a5838f abc xyz
878933fa4965c31c88ee8696a1a5838f abc xyz
878933fa4965c31c88ee8696a1a5838f abc xyz
878933fa4965c31c88ee8696a1a5838f abc xyz
878933fa4965c31c88ee8696a1a5838f abc xyz
878933fa4965c31c88ee8696a1axxxxx abc xyz
878933fa4965c31c88ee8696a1a5838f abc xyz
878933fa4965c31c88ee8696a1a5838f abc xyz
878933fayyyyyy1c88ee8696a1a5838f abc xyz
878933fa4965c31c88ee8696a1a5838f abc xyz
878933fa4965c31c88ee8696a1a5838f abc xyz
我想挑選並只顯示 「878933fa4965c31c88ee8696a1axxxxx」 和 「878933fayyyyyy1c88ee8696a1a5838f」
前綴代碼有四個空格。請看[編輯幫助](http://stackoverflow.com/editing-help)。 – Cyrus
澄清**爲什麼**這將是預期的輸出,特別是爲什麼'878933fa4965c31c88ee8696a1a5838f'不包括在輸出中。 –
它是一個文件的md5sum編碼。如果一個或兩個文件代碼與15個左右的總數不同,我想選擇一個文件的md5sum。或找出不同步的檔案。 – skumble