捕捉重複組我有一個郵件日誌文件,該文件是這樣的:在python正則表達式
Aug 15 00:01:06 **** sm-mta*** to=<[email protected]>,<[email protected]>,[email protected], some_more_stuff
Aug 16 13:16:09 **** sendmail*** to=<[email protected]>, some_more_stuff
Aug 17 11:14:48 **** sm-mta*** to=<[email protected]>,<[email protected]>, some_more_stuff
我要的是所有的郵件主機中含有「SM-MTA」線列表。在這種情況下,這將是:['gmail.com', 'yahoo.com', 'aol.com', 'gmail.com', gmail.com']
re.findall(r'sm-mta.*[email protected](.*?)[>, ]')
將返回每個匹配行(['gmail.com','gmail.com']
)
re.findall(r'[email protected](.*?)[>, ]')
將返回正確的列表中只有第一臺主機,但我需要過濾了。有沒有解決這個問題的方法?
你可以試試這個https://eval.in/875159 –