2017-09-23 41 views
0

所以我有一個非常大的數據庫,問題是找出不正確的格式電子郵件地址。請幫助我,謝謝!如何使用grep/egrep查找不正確的電子郵件地址?

1:有多少條記錄的電子郵件地址不正確(行中有@,但格式不正確)?電子郵件地址具有用戶標識,而域名可以由字母,數字,句點和破折號組成。一個電子郵件地址應該有一個頂級域名(something.top-leveldomain)。頂級域名的格式爲:com,org,edu等,

我知道如何找到電子郵件地址:grep -E「\ b [A-Za-z0-9 ._%+ - ] + @ [A-Za-z0-9 .-] +。[A-Za-z] {2,6} \ b「HW1_Data.txt; 但如果我使用grep -E -v「\ b [A-Za-z0-9 ._%+ - ] + @ [A-Za-z0-9 .-] +。[A-Za-z] { 2,6} \ b「HW1_Data.txt,我只會得到一切,但電子郵件..所以我只是不知道該怎麼辦

回答

0

請運行grep @ HW1_Data.txt獲取所有可能是電子郵件的行地址。然後排除無效的。答案是

grep @ HW1_Data.txt | grep -E -v「\ b [A-Za-z0-9._%+ - ] + [A-Za-z0-9 .-] +。[A-Za-z] {2,6} b「

+0

這就是我所做的......,但這個命令只會得到一切,但電子郵件!我需要得到不正確的格式電子郵件 – James

相關問題