我有2個文件,這將每日更新基於一些在線提要,文件包含了輸入的喜好和日常一些新的線路將被添加,有些將被刪除。此外,每天文件中行的順序也會改變。因此,我想提取今天添加的行,並且想知道昨天有多少行被刪除?
方法我也跟着:
假設說3個文件2017-07-17.txt , 2017-07-18.txt and 2017-07-19.txt
文件有如下數據。
2017-07-17.txt
a
b
c
2017-07-18.txt
a
b
d
e
f
2017-07-19.txt
f
e
a
c
b
d
g
Did d iff前兩個文件。
3d2
< c
4a4,5
> e
> f
從輸出中很容易提取數據,並知道什麼是刪除和添加什麼。但我的輸入範圍從每天10萬到200萬行數據,因此使用diff
不起作用。
問題我這種方法
中面臨當哪天說2017-07-19.txt
輸入改變了順序,diff
邏輯運作非常有線,因爲它掃描線,以線。
$ diff 2017-07-18.txt 2017-07-19.txt
0a1,2
> f
> e
1a4
> c
4,5c7
< e
< f
---
> g
是否有任何解決方案,我可以用來得到這樣的輸出。
預期輸出:
$ diff 2017-07-18.txt 2017-07-19.txt
Addeed : c
g
Deleted : None
它與python有什麼關係? – Rahul