我想編寫一個腳本或類似.xml文件,它明確定義Hadoop集羣中的datanodes來存儲特定的文件塊。例如: : 假設有4個從節點和1個主節點(hadoop集羣中共有5個節點)。 有兩個文件file01(大小= 120 MB)和file02(大小= 160 MB)。默認塊大小= 64MB如何明確定義datanode以將特定給定文件存儲在HDFS中?
現在我想將file01的兩個塊中的一個存儲在從屬節點1和另一個從屬節點2 。 類似於從節點1處的file02三個塊中的一個,從節點3處的第二個節點處以及從節點4處的第三個塊。 所以,我的問題是我該如何做到這一點?
居然還有一個方法:請在CONF更改/奴隸文件中的每個存儲文件的時間。 但我不想這樣做 因此,還有另一種解決方案來做到這一點? 我希望我明確表達自己的觀點。 等待你的迴應.. !!!
請放下幾句話爲什麼你需要它 –
@DavidGruzman 我想確保一個特定的數據節點肯定存儲在一個特定的文件的某些塊..我的意思是可以幫助我在集羣內使用負載平衡hadoop與其他一些集羣管理框架.. –