1
對於不可拆分的文件,例如GZIP
,將只有一個映射作業,因爲GZIP
文件不可拆分。是否有任何選擇或優化將這些文件的所有塊存儲在一個數據節點中,這樣我們至少可以節省網絡帶寬?HDFS是否將不可拆分的文件存儲在一個數據節點中?
對於不可拆分的文件,例如GZIP
,將只有一個映射作業,因爲GZIP
文件不可拆分。是否有任何選擇或優化將這些文件的所有塊存儲在一個數據節點中,這樣我們至少可以節省網絡帶寬?HDFS是否將不可拆分的文件存儲在一個數據節點中?
爲您的gzip文件增加HDFS塊大小應該大於文件大小。有關設置每個文件的HDFS塊大小的更多信息,請參見answer