如果存在僅包含映射且沒有reduce的作業,並且要處理的所有數據值都映射到單個鍵,那麼該作業是否只能在單個節點上處理?Hadoop映射進程
0
A
回答
0
直接來自Hadoop權威指南,第6章剖析Map減少作業運行。
「創建任務運行列表中,作業調度器首先檢索 從共享文件系統由客戶端計算的輸入分裂。它 然後爲每個分割創建一個地圖的任務。reduce任務的數量 創建的數據由 作業中的mapred.reduce.tasks屬性確定,該作業由setNumReduceTasks()方法設置,而調度程序 僅創建此數量的要執行的reduce任務,任務給出爲 此處的ID點。」
1
第 基本上,節點的數量將由映射器的數量決定。 1個映射器將在1個節點上運行,N個節點上映射N個映射器,每個映射器有一個節點。 您的工作所需的映射器數量將由Hadoop設置,具體取決於數據量以及您的數據將被拆分的塊的大小。每個數據塊將由1個映射器處理。 因此,例如,如果您有大量的數據,將其分成N個塊,則需要N個映射器來處理它。
相關問題
- 1. Hadoop:映射二進制文件
- 2. Hadoop遞歸映射
- 3. 進程間映射與映射/ unordered_map
- 4. 的Hadoop的map-reduce映射編程
- 5. Hadoop無法找到映射程序
- 6. Hadoop - 文件到塊映射
- 7. Hadoop的流單映射
- 8. Hadoop的許多映射器
- 9. hadoop過濾映射輸出
- 10. Hadoop未找到映射類
- 11. Hadoop幾個映射器
- 12. HADOOP:從映射器發射矩陣
- 13. Hadoop日誌鍵是否映射到reducer映射?
- 14. 使用二進制數據級聯hadoop流式映射還原
- 15. 使用Hadoop通過兩個數據集進行映射
- 16. Hadoop Streaming:映射器'包裝'二進制可執行文件
- 17. Hadoop中的映射器數量
- 18. Hadoop排序映射並減少鍵值
- 19. Hadoop的映射器運行緩慢
- 20. hadoop映射器靜態初始化
- 21. 由於ConnectException,Hadoop映射失敗
- 22. 我如何開始爲Hadoop映射?
- 23. HADOOP - 獲取映射器內的nodename
- 24. Hadoop術語映射到硬件
- 25. Hadoop流式縮減器映射器
- 26. Tuple作爲Hadoop映射器中的鍵
- 27. 分離Hadoop映射並減少任務
- 28. hadoop mapreduce只執行一個映射器
- 29. awk不Hadoop中的映射工作
- 30. hadoop設置方法映射器
正確,但許多映射器可以在同一個節點上運行(可配置的編號) – vefthym