0
A
回答
1
,如果你想找到最大尺寸的文件試試這個shell腳本:
h1out="/path/to/out/file/hadoop-ls-out.txt"
a1out="/path/to/out/file/hadoop-awk-out.txt"
h1="`hadoop fs -lsr /usr > $h1out`"
a1="`awk '{print $5,$8}' $h1out > $a1out`"
a2="`awk 'BEGIN{first=1;}{if (first) { max = min = $1; first = 0; next;}if (max < $1) max=$1; if (min > $1) min=$1; }END { print max }' $a1out`"
g1="`grep -r $a2 $a1out`"
echo $g1
說明:
h1out
是文件路徑存放hadoop fs -lsr輸出
a1out
是存儲AWK輸出
h1
列出了我的HDFS路徑遞歸文件在/usr
和文件路徑存儲在h1out
a1
打印的文件大小和名(完整路徑)從h1out
文件保存在a1out
文件中
a2
找到分鐘和從最大文件大小值,但我只使用max(因爲你需要最大),所以它僅顯示最大文件大小
g1
用於$a2
值搜索文件a1out
並打印出來。此結果打印文件大小和文件名稱與max fileseize。
注:如果您正在使用最新版本的Hadoop,以 「HDFS DFS」 替換 「Hadoop的FS」
相關問題
- 1. Python的遞歸找到文件夾或子文件夾
- 2. 在目錄中查找最舊的文件(遞歸)
- 3. 遞歸從子目錄將文件移動到文件夾中的父目錄
- 4. 遞歸地查找目錄中的文本文件的計數
- 5. 遞歸讀取目錄與文件夾
- 6. 遞歸查找目錄中的所有文本文件
- 7. 查找文件夾中的所有.php文件遞歸
- 8. Powershell防止父文件夾的遞歸查找只搜索子文件夾
- 9. pysmb刪除遞歸的文件夾子文件夾和文件
- 10. 模板文件夾子目錄中的遞歸樹枝模板文件搜索
- 11. 如何在Perl腳本中遞歸查找文件/文件夾?
- 12. Flume「假脫機目錄源」遞歸 - 查找子目錄內的文件
- 13. 遞歸複製文件和文件夾和子文件夾
- 14. 遞歸查找目錄中文件的數量
- 15. c#遞歸文件夾和文件目錄
- 16. 遞歸查找文件夾層次結構中每個文件夾的最新文件。
- 17. 遞歸文件夾
- 18. 從最裏面到最外面的目錄查找一個文件(遞歸)
- 19. 遞歸查找文件夾名稱(不是文件)
- 20. 如何在目錄中遞歸地查找文件
- 21. web2py的子目錄查看文件夾
- 22. Bash在當前文件夾中找到和#名稱#子文件夾遞歸地
- 23. 刪除空目錄或文件夾/子文件夾
- 24. 遞歸地tar'ing主文件夾的子文件夾
- 25. HDFS中的最大文件名大小
- 26. Python遞歸搜索目錄以查找文件的存在
- 27. 查找不包含文件的目錄遞歸
- 28. 在文件夾和子文件夾中查找文件
- 29. Clojure中的Hdfs文件夾大小
- 30. 如何在子目錄中找到最大的文件?
你所說的 「MAX」 是什麼意思?最大的文件?最後一個文件命令是光盤命令? – Keegan