我有兩個文件,兩者都非常大。這些文件混合了它們之間的信息,我需要比較兩個文件並連接相交的線。從兩個filles連接類似的線
一個例子是:
一號文件有
var1:var2:var3
2日將有
var2:var3:var4
我需要這些在第三個文件,輸出連接:var1:var2:var3:var4
。 請注意,行不匹配,var4應與var1一起使用(因爲它們有var2
和var3
在一起)。 Var2和Var3在Var1和Var4中很常見。可能在這些巨大的文件中很遙遠。 我需要找到一種方法來比較每一行並將其連接到第二個文件中的一行。我似乎無法想到任何足夠的循環。有任何想法嗎?
你如何辨別時,兩行有兩個或更多的記錄(在你的例子中「var _ _」)是共同的嗎?至少有一個共同點? –
mojo
創建的第三個文件必須採用以下格式:var1:var2:var3:var4。 var2和var3對於var1和var3是很常見的。 Var2和Var3總是成對出現,所以如果一個是共同的,另一個是共同的。 – user3184354
你保證'var2'只出現在每個文件中一次嗎?兩個文件之間的「十字路口」是否保證只存在一次?也就是說,從file1開始的一行,是否會有多行包含它所包含的記錄(例如'var2'或'var4')? – mojo