0
Hadoop的行業標準複製因子是3.那麼這是否意味着如果有100 GB的數據,那麼在HDFS中它將被存儲爲300 GB?Hadoop複製因子是3.如何存儲多少數據?
Hadoop的行業標準複製因子是3.那麼這是否意味着如果有100 GB的數據,那麼在HDFS中它將被存儲爲300 GB?Hadoop複製因子是3.如何存儲多少數據?
是的。
還有其他因素,例如塊大小(默認爲128MB),當文件非常小或略大於塊大小時可能會引入碎片,但通常HDFS中的100GB等於磁盤上的300GB。
請記住,在對該數據進行操作期間,還會創建其他臨時文件 –