我有一個非常奇怪的問題。我有三個文件,其中包含一列數字。我只需要從第一個文件中獲取唯一值,這些值不會出現在第二個和第三個文件中。兩個文件比較
我試過的Python這樣的:
for e in firstfile:
if e not in secondfile:
resultfile.append(e)
return resultfile
而同爲第三檔。
我試過的uniq,排序,DIFF,一些AWK腳本和通訊在Linux的shell喜歡這裏:Fast way of finding lines in one file that are not in another?
但唯一的結果,每次我得到的是線條的相同數額,因爲這是在以往的第一個文件。我一點都不明白!
也許,我錯過了什麼?也許這是一種格式?不過,我查了很多次。這裏是文件:http://dropmefiles.com/BaKGj
P.S.後來我認爲根本沒有獨特的線條,但我手動檢查了它,第一個文件中的一些數字是唯一的。
P.P.S.文件的格式是這樣的:
380500100000
380500100001
380500100002
380500100003
380500100004
380500100005
380500100008
380500100020
380500100022
380500100050
380500100070
380500100080
如果它只是一列數字,那麼您應該包含20個來自eacg的數據,這樣我們就可以瞭解您使用的數據。將這些文件放在Dropmefiles中將不會在將來7天內移除文件。我也會加載第一個文件,然後刪除從第二個和第三個文件加載的所有內容(如果它存在於第一個文件中)。 – IvanD
當然,這是一個不錯的音符。你是俄羅斯人嗎? – tiredsys