2015-04-22 50 views
1

我已經發送到我,因爲種種原因一些數據,發送方成功地將數據並排三次複製,就像這樣:記事本++一行刪除詞重複的

FileVersion 1 FileVersion 1 FileVersion 1 
FileRevision 0 FileRevision 0 FileRevision 0 
EDSVersion 4.0 EDSVersion 4.0 EDSVersion 4.0 
Description Gen4 (T,P,PS - DRL PMAC)26 April 2012 1 Description Gen4 (T,P,PS - DRL PMAC)26 April 2012 1 Description Gen4 (T,P,PS - DRL PMAC)26 April 2012 1 
CreationTime 02:02PM CreationTime 11:53AM CreationTime 06:28PM 
CreationDate 02-27-2013 CreationDate 02-27-2013 CreationDate 02-26-2013 

我需要刪除每個副本,並且數據中只有22,000行。有沒有辦法在Notepad ++中刪除重複的短語?

+0

您需要一些腳本才能使用某種語言。據我所知,IDE沒有這種功能。 –

+0

字段是如何分隔的?通過標籤,有任何機會?如果是這樣,你可以使用正則表達式。 –

回答

1

你可以這樣做:

查找內容:^(.+)\1\1
替換:$1

這將幾乎所有線路的工作除了CREATIONTIME & CreationDate,因爲這些線路具有可變的部分。

0

原來所有的數據都是製表符分隔的,所以我用「,」替換了所有「\ t」,在Excel中以CSV格式打開它,並在前兩列後刪除所有內容。像魅力一樣工作。