大問題: 我想要一個數據框中兩個字段之間的唯一組合列表。awk從2列刪除鏡像副本
示例數據:
A B
C D
E F
B A
C F
E F
我希望能夠得到的4種獨特的組合結果:AB,CD,EF,和CF.由於BA和和BA含有相同的成分,但以不同的順序,我只想要一個副本(它是如此BA相互關係是一回事AB)
嘗試:
到目前爲止,我已經嘗試排序,並保持獨特行:
sort file | uniq
當然能產生5種組合,但:
A B
C D
E F
B A
C F
我不知道如何處理AB/BA被認爲是一樣的。有關如何做到這一點的任何建議?
是否真實數據只有兩個字符,也可以是兩個以上的? –
@George對不起,我沒有指定 - 真正的數據是每列多個字符,但詹姆斯和埃德提供了適用於多個字符的答案 – user4670961
我建議包括一個多字符樣本輸入/期望輸出;是可能的一些解決方案打破多個字符... –