0
A
回答
0
使用排序與uniq的找到重複的行。
#!/bin/bash
dirs=("[email protected]")
for dir in "${dirs[@]}" ; do
cat "$dir"/*
done | sort | uniq -c | sort -n | tail -n1
uniq -c
將出現次數預先考慮到每個線路sort -n
將由出現tail -n1
的數的行進行排序將只輸出的最後一行,即最大值。如果你想看到所有具有相同數量的重複的線條,添加以下的,而不是尾巴:perl -ane 'if ($F[0] == $n) { push @buff, $_ } else { @buff = $_ } $n = $F[0]; END { print for @buff }'
1
像這個?:
$ cat > foo
this
nope
$ cat > bar
neither
this
$ sort *|uniq -c
1 neither
1 nope
2 this
並剔除與只是那些1s:
... | awk '$1>1'
2 this
0
您可以使用awk。如果你只是想「統計重複行數」,我們可以推斷出你在「在同一個文件中出現過的所有行」之後。下面會產生這些罪狀:
#!/bin/sh
for file in "[email protected]"; do
if [ -s "$file" ]; then
awk '$0 in a {c++} {a[$0]} END {printf "%s: %d\n", FILENAME, c}' "$file"
fi
done
的awk腳本首先檢查當前行存儲在陣列a
中,如果確實如此,計數器加一。然後它將該行添加到其數組中。在文件末尾,我們打印總數。
請注意,這可能在非常大的文件上有問題,因爲整個輸入文件需要讀入數組的內存中。
實施例:
$ printf 'foo\nbar\nthis\nbar\nthat\nbar\n' > inp.txt
$ awk '$0 in a {c++} {a[$0]} END {printf "%s: %d\n", FILENAME, c}' inp.txt
inp.txt: 2
這個詞「酒吧」存在文件中的三次,從而有兩個重複。
匯聚多個文件,你可以養活多個文件AWK:
$ printf 'foo\nbar\nthis\nbar\n' > inp1.txt
$ printf 'red\nblue\ngreen\nbar\n' > inp2.txt
$ awk '$0 in a {c++} {a[$0]} END {print c}' inp1.txt inp2.txt
2
爲此,字「棒」在第二個文件中的第一個文件中出現兩次,一次 - 共三次,因此我們仍然有兩個重複。
相關問題
- 1. 在文件中查找重複行並計算每行重複的行數?
- 2. 如何計算每個月而不重複該行?
- 3. 如何統計每個目錄中的文件數量?
- 4. 我應該如何統計PDO中所有已刪除的行?
- 5. 如何統計PHP中每個來自MySQL的重複值的總數?
- 6. 如何統計重複的整數
- 7. MySQL的統計重複行
- 8. 如何統計每行的列數?
- 9. 如何統計在mongodb中重複的文件?
- 10. 如何計算txt文件中的重複行數
- 11. 如何統計PIG中的重複值
- 12. 如何統計scala中的重複值?
- 13. 如何統計cakephp中的重複值?
- 14. 如何統計多個字典中重複鍵的數量?
- 15. 如何統計pandas組中每個對象的行數?
- 16. 如何統計一個csv文件的每一行出現的次數,在python
- 17. 如何檢查重複行並在excel文件中計算該行?
- 18. 我該如何統計我的按鍵頻率和計數
- 19. 我應該如何重構此設計
- 20. Powershell。統計文件中重複條目的數量
- 21. 如何統計jsp中表格的每一行中的多個複選框
- 22. 如何在linq中統計重複?
- 23. 我如何總計每個文件查詢計數?
- 24. 如何統計同一個表中的每個人的行爲?
- 25. 我如何統計文本文件中的數字摘要?
- 26. 我如何計算我的Perl代碼中每個子句的相應行數?
- 27. 如何統計數據庫中重複記錄的數量?
- 28. 如何統計變量在javascript數組中重複的次數?
- 29. 使用bash統計文件中每個字的出現次數
- 30. 如何統計多索引數據框中每天的行數?
對於導演中的多個文件,重複項可能包含在目錄中的許多文件中,或者不同文件中的重複行數是否重複?另外你認爲是重複的?一些假裝數據和你想要的數量在這裏會有很大的幫助。 – JNevill
實際上,包含在目錄中的許多文件中的重複行的格言 –
重複的行意味着重複的行 –