我是hadoop的新手,我對此有以下問題。Hadoop任務可以在單個節點上並行運行
這就是我在hadoop中理解的。
1)當過任何文件寫入Hadoop中它存儲所有數據節點的數據塊(64MB默認)
2)當我們運行的MR工作,分裂將從此塊中創建和在每個數據節點上分割將被處理。
3)從每個分割記錄讀取器將被用來在映射器端生成鍵/值對。
問題:
1)一個數據節點可以一次處理多個分割嗎?如果數據節點容量更大?
我認爲這是MR1的侷限性,而用MR2 YARN我們有更好的資源利用率。
2)將在數據節點上以串行方式讀取拆分,還是可以並行處理以生成鍵/值對? [通過隨機訪問數據節點拆分中的磁盤位置]
3)map/reduce體系結構中的'slot'術語是什麼?我正在閱讀其中一篇博客,它說YARN將在Datanode中提供更好的插槽利用率。