我有一個包含數千行文本的文本文件,其中包含域名列表,後面是具有不同信息的時間段(數字,空格和其他信息)如何用sed刪除部分重複的行?
某些域的值可能超過1行信息,具有不同數量和信息之後,如在本例中結構域1和4
domain1.foo. 3600 ...
domain1.foo. 1800 ...
domain2.foo. 900 ...
domain3.foo. 60 ...
domain4.foo. 3600 ...
domain4.foo. 1200 ...
domain4.foo. 1200 ...
重複的選只會是彼此下方線(例如,涉及domain4線可以是線50,51,52 ,但從來沒有50,60和400)。
所以我試圖做的就是創建用sed刪除包含每個域名,不管以後會發生什麼任何重複的行 - 因此,例如將成爲
domain1.foo. 3600 ...
domain2.foo. 900 ...
domain3.foo. 60 ...
domain4.foo. 3600 ...
我只是有一個基本知識正則表達式,並希望得到一些有關如何去做這件事的幫助。我設法得到格式化的列表,所以製表符和雙空格都被刪除了,但我需要一些幫助。