我有重複的文本行的文本文件,但我只想要每一個。 想象一下這樣的文本文件:提取所有的獨特行
AAAAA
AAAAA
AAAAA
BB
BBBBB
BBBBB
CCC
CCC
CCC
我只需要以下四行從中:
AAAAA
BB
BBBBB
CCC
我使用文本編輯器(EmEditor中或記事本+ +),支持正則表達式,而不是一個編程語言,所以我必須使用純正則表達式。
任何幫助?
編輯: 我檢查了hsz提到的另一個線程,我想說清楚這個是不一樣的。 儘管兩者都需要刪除重複的行,但實現它的方式卻有所不同。 我需要純正RegEx,但來自其他線程的最佳答案依賴於特定的Notepad ++插件(甚至不會再有它),所以它甚至不是一個正則表達式解決方案。 那裏的第二種情況是一個正則表達式,它可以在Notepad ++上工作,但不能在EmEditor上工作,這也是我需要的。 所以我不認爲我的問題是重複那個,雖然那個鏈接是有用的,所以我感謝hsz。
[在記事本中刪除重複的行++](http://stackoverflow.com/questions/3958350/removing-duplicate-rows-in-notepad) – hsz
重複線組合在一起的可能重複?也就是說,該文件可以是AAAA BBBB AAAA BBBB,以便您想讓它成爲AAAA BBBB? –
Gelbukh的答案:行必須與最初的順序完全相同。 –