我正在尋找hadoop 2.x中的命令來刪除hdfs中零字節的文件。 任何人都可以讓我知道適當的命令。 我正在嘗試在hdfs中查找零字節的文件,並將它們從目錄中刪除。hadoop刪除零文件的文件
4
A
回答
4
for f in $(hdfs dfs -ls -R/| awk '$1 !~ /^d/ && $5 == "0" { print $8 }'); do hdfs dfs -rm "$f"; done
循序漸進:
hdfs dfs -ls -R /
- 列出HDFS中的所有文件遞歸
awk '$1 !~ /^d/ && $5 == "0" { print $8 }')
- 打印是不是目錄,並用大小爲0
for f in $(...); do hdfs dfs -rm "$f"; done
那些完整路徑 - 反覆刪除
2
建立在Kombajn的答案,如果你有很多文件刪除它將是qui cker使用xargs
。這將允許您刪除多個文件,每個hdfs
命令,這是相當昂貴的。
hdfs dfs -ls -R/| awk '$1 !~ /^d/ && $5 == "0" { print $8 }' | xargs -n100 hdfs dfs -rm
相關問題
- 1. 從AWS中刪除文件系統 - Hadoop
- 2. 刪除Hadoop文件系統中的文件(hdfs)
- 3. 刪除空文件(零字節)
- 4. PHP腳本刪除零字節文件
- 5. 文件#刪除不刪除文件
- 6. 刪除文件
- 7. 刪除文件
- 8. 刪除文件
- 9. 刪除文件
- 10. 文件刪除
- 11. 刪除文件
- 12. 刪除文件
- 13. 刪除文件
- 14. 刪除文件
- 15. Hadoop Hive更新,插入和刪除文本文件格式?
- 16. 刪除文件夾中的所有文件,排除某些文件被刪除
- 17. 刪除文件排除文件
- 18. 零填充:如何從文件結尾刪除零?
- 19. 清除文件夾 - 刪除文件夾中的文件 - J2ME
- 20. 刪除/刪除/撤銷零件
- 21. C編程 - 如何刪除文本文件尾隨零
- 22. 刪除APPDATA文件夾內的文件
- 23. htaccess刪除文件夾的文件夾
- 24. 刪除包含文件的文件夾
- 25. 刪除了文件瀏覽器中的文件刪除器
- 26. Git的部署:在刪除文件時,按文件中刪除
- 27. grgit - 添加新文件並刪除已刪除的文件
- 28. 刪除文件夾內的所有文件,但刪除最後?
- 29. 批處理文件,刪除文件,還創建刪除文件的日誌
- 30. 如何在已刪除的文件夾中刪除已刪除的文件
你介意解釋這裏使用的awk腳本嗎? – ylabidi
@ylabidi展開Kombajn描述的內容,他打印來自'ls'的行不是以'd'(目錄)開頭,並且第5個字段(大小)不爲0的行的字段8(文件名) – highlycaffeinated