如何找到一個HDFS文件的大小的大小?應該使用什麼命令來查找HDFS中任何文件的大小。如何找到一個HDFS文件
回答
您可以使用hadoop fs -ls
命令列出當前目錄中的文件及其詳細信息。命令輸出中的第5列包含文件大小(以字節爲單位)。
例如,命令hadoop fs -ls input
給出以下輸出:
Found 1 items
-rw-r--r-- 1 hduser supergroup 45956 2012-07-19 20:57 /user/hduser/input/sou
文件sou
的大小是45956個字節。
我也發現自己使用hadoop fs -dus <path>
很多。例如,如果在名爲HDFS「/用戶/ frylock /輸入」目錄中包含100個文件,你需要爲所有這些文件的總大小,你可以運行:
hadoop fs -dus /user/frylock/input
,你還是會回到總規模(以字節爲單位)「/ user/frylock/input」目錄中的所有文件。
另請注意,HDFS冗餘存儲數據,因此文件使用的實際物理存儲量可能是hadoop fs -ls
和hadoop fs -dus
報告的3倍或更多。
除了最後一點 - 複製因子是在權限標誌之後和所有者之前顯示的數字(@ adhunavkulkarni的答案中的第2列) – 2012-07-20 10:39:43
hadoop fs -du -s
使用'Hadoop的FS -du -s -h /用戶/ frylock/input'一個更加可讀的輸出。 – axiom 2015-12-11 23:23:03
如果你想通過API來實現,你可以使用'getFileStatus()'方法。
這是不正確的,它不返回文件大小它返回分配的塊大小,它不會爲零的空文件。默認是67108864. – user1613360 2014-11-30 06:23:33
我用下面的函數幫助我獲得文件大小。
public class GetflStatus
{
public long getflSize(String args) throws IOException, FileNotFoundException
{
Configuration config = new Configuration();
Path path = new Path(args);
FileSystem hdfs = path.getFileSystem(config);
ContentSummary cSummary = hdfs.getContentSummary(path);
long length = cSummary.getLength();
return length;
}
}
請問如果這返回7906那麼該目錄的大小是多少?它是以字節還是以kbs爲單位? – retiremonk 2016-01-27 15:54:41
查看命令下面awk腳本看到濾波的輸出的大小(在GB)在HDFS:
hadoop fs -du -s /data/ClientDataNew/**A*** | awk '{s+=$1} END {printf "%.3fGB\n", s/1000000000}'
輸出---> 2.089GB
hadoop fs -du -s /data/ClientDataNew/**B*** | awk '{s+=$1} END {printf "%.3fG\n", s/1000000000}'
輸出---> 1.724GB
hadoop fs -du -s /data/ClientDataNew/**C*** | awk '{s+=$1} END {printf "%.3fG\n", s/1000000000}'
輸出---> 0.986GB
- 1. 如何使用Java API將文件從一個HDFS文件夾複製到另一個HDFS文件夾?
- 2. 使用java將hdfs文件複製到另一個hdfs位置
- 3. 如何把一個文件添加到hdfs與輔助組?
- 4. 如何將文件複製到HDFS?
- 5. 如何將gzip文件移動到hdfs
- 6. 如何用Snappy壓縮文件到HDFS
- 7. 如何從HDFS獲取文件到S3
- 8. HDFS如何知道從哪個主機我們得到一個文件
- 9. 如何將多個文件從hdfs上傳到單個s3文件?
- 10. 如何將hdfs文件複製到另一臺服務器[linux]
- 11. 在Java中讀取一個文件hdfs
- 12. 找到一個文件夾
- 13. PHP如何找到一條直線從一個文本文件
- 14. IOException寫入文件到Hdfs
- 15. 上傳文件到hadoop hdfs?
- 16. 如何從一個HDFS文件中的Hadoop
- 17. 如何將文件從HDFS複製到本地文件系統
- 18. 多個文件流hdfs
- 19. 只有一個文件到hdfs從kafka與水槽
- 20. 如何找到一些文件目錄
- 21. HDFS把本地文件放到hdfs中,但得到了UnresolvedAddressException
- 22. 如何在一組tarball中找到一個特定的文件?
- 23. 如何在一個文件中找到一行的中間
- 24. 如何找到一個Github上文件的SHA一滴
- 25. HDFS小文件
- 26. 如何輸入HDFS文件爲R的MapReduce進行處理,並得到結果到HDFS文件
- 27. 如何找到哪個pip包擁有一個文件?
- 28. 我如何找到哪個磚在glusterFS上有一個文件
- 29. 何處上傳hdfs文件?
- 30. HDFS匯:如何擺脫由水槽在HDFS中的每一個事件添加時間戳的文件
你將如何輸出的大小在人類可讀的形式? -ls - lah在這裏不起作用 – 2017-11-07 13:21:14