2013-10-29 63 views
2

我有一個擁有8臺機器並且所有8臺機器都是數據節點的Hadoop集羣。 在一臺機器上運行的程序(比如機器A)會持續在HDFS中創建序列文件(每個文件大約1GB)。HADOOP HDFS不平衡問題

下面是問題:所有8臺機器都是相同的硬件,並具有相同的容量。當其他機器的HDFS磁盤剩餘空間仍有50%左右時,機器A只剩下5%。 我檢查了塊信息,發現幾乎每個塊在機器A上都有一個複製品。

有沒有什麼辦法來平衡複製品? 謝謝。

回答