2015-08-15 44 views
2

我有一個電子郵件列表如下:如何確定特定字符後每行的唯一性?

如何刪除所有重複的電子郵件都基於域名?所以在上面的例子中,我會刪除[email protected][email protected]_3.com。

我知道如何使用uniq的,但它似乎並沒有確定之前唯一支持跳轉到下@字符。

回答

0

分解這個問題,看起來你只想保留每個域的第一個地址。要做到這一點,你首先得到一個唯一的域名列表,然後用head來保留其中的第一個。

#!/bin/sh 
DOMAINS=$(cut [email protected] -f2 unsorted.txt | sort | uniq) 
for DOMAIN in $DOMAINS ; do 
    grep $DOMAIN unsorted.txt | head -1 
done 
+0

先生,你是一個紳士和學者:假設你有這些地址一行在一個名爲unsorted.txt文件中的這個時間可以用類似來完成。我的謝意。 –

相關問題