我有兩個.csv文件。一個有info1,另一個有info2。文件看起來像這樣
文件1:檢查csv文件是否有相同的項目
20170101,,,d,4,f,SWE
20170102,a,,,d,f,r,RUS <-
文件2:
20170102,a,s,w,,,,RUS <-
20170103,d,r,,,,FIN
我想這兩條線相結合(標記爲 「< - 」),並聯合一行:
20170102,a,s,w,d,f,r,RUS
我知道我可以做類似這樣的腳本:
for row1 in csv_file1:
for row2 in csv_file2:
if (row1[0] == row2[0] and row1[1] == row2[1]):
do something
是否有任何其他方法來找出哪些行在開始時有相同的項目,或者這是唯一的方法?這是找出相似之處的非常緩慢的方式,並且需要幾分鐘才能在100 000行文件上運行。
我會建議合併文件,然後按前兩列排序而不是嵌套循環 –
哪些列使行匹配?它只是第一列(所以,例如,RUS將不會有20170101)或組合?另外,訂單是否重要? – tdelaney
一行中有35個項目。項目0-4在兩個文件中,5-9在文件1中,10-20在文件2中,21-34在兩者中。 – tmi12