-1
我想比較具有不同數量的內容的兩個巨大的CSV文件。只有一列包含相同的值,例如它們也存在於同一列中的另一個文件中,這個值要大得多。比較兩個CSV文件的列並刪除差異
所以我想保留其中一個文件的行中第二個文件中具有相同值的行也存在。
例子:
File a
value1,value2,value3,...
value4,value5,value6,...
value7,value8,value9,...
File b:
value10,value2,value11,...
value12,value13,value14,...
最終文件B(或者一個完整的新文件)應該是這樣的:
value10,value2,value11,...
我不相信它是很難,但此刻我不知道如何做到這一點。我怎麼能用linux工具或bash/python腳本來達到目標?
感謝您的任何提示!
基本上你想實現B.Columns-A.Colums? –
什麼是「巨大」以及文件大小(和行數)的差異有多大? – hop
@ChetanKulkarni正確,想擺脫與一列相關的差異。 – Kay