我有一個數據文件fortune包含許多重複的命運。我想刪除它們。刪除重複文本之間的間隔
財富被%
的劃定,所以樣本財富文件可能是這樣的:
%
This is sample fortune 1
%
This is
sample fortune 2
%
This fortune
is repeated
%
This is sample fortune 3
%
This fortune
is repeated
%
This fortune
is unique
%
正如你所看到的,命運可以在多行跨越,呈現solutions here沒用。
我該怎麼做才能找到並消除重複的命運?我想找到一種方法來讓awk
忽略以%
開頭的行,但有些命運共享相同的行,但總體上並不相同(比如我的例子中的最後兩行),所以這還不夠。
到目前爲止,我一直試圖解決這個與awk
,但任何工具都很好。
我不知道'RS'和'ORS'變量。這是我錯過的關鍵。 – SnoringFrog
確實,它們非常強大!我建議總是考慮*記錄*而不是*行* – hek2mgl