是否需要在運行Hadoop的所有節點上部署包含我的Mapper/Reducer類的JAR文件?或僅在主節點(名稱節點)上?Mapper和Reducer類是否需要部署在Hadoop集羣的所有節點上
0
A
回答
3
簡答:
node/gateway
從您開始MapReduce作業的機器。您需要將主要的MapReduce Driver
jar放在本地文件系統中,並且所有依賴關係jar可以放入local file system
或HDFS
路徑。所以當你開始這項工作時,你將通過使用-libjars
參數傳遞依賴庫jar路徑。 HDFS罐子將在其HDFS中的路徑前綴中包含前綴hdfs://
。在本地系統上需要主MapReduce jar來啓動mapreduce作業,該作業實質上聯繫資源管理器(Hadoop-2),用於爲作業分配特定應用程序應用程序主文件。
Hadoop的設計使用數據局部性的概念。在現實世界中,數據的大小遠遠大於需要在數據上執行的代碼的大小。可執行的jar文件被傳輸到本地包含數據塊的節點。這將網絡傳輸時間減到最少。
0
這是一個棘手的問題。
您的jar需要在所有節點中本地執行至少一項作業(Map和/或Reducer)的作業(不是所有節點)。 但是你不需要自己發佈你的jar。這就是hadoop基於ResourceManager及其MapReduce框架知道如何去做的。hadoop jar命令是誰啓動的過程。如果您的MapReduce應用程序需要外部依賴項(其他jar),那麼您需要將它們提供給hadoop並指定它們在節點之間分佈。
相關問題
- 1. Hadoop中的Mapper和Reducer
- 2. Mapper和Reducer應該是內部類嗎?
- 3. 在hadoop集羣上部署Mahout
- 4. xyz場景需要多少mapper和reducer?
- 5. Hadoop的2節點集羣
- 6. 所有kafka集羣節點上的SSL
- 7. 單個節點羣集中的Hadoop塊大小需要明確
- 8. Hadoop多節點羣集
- 9. Mahout是否需要安裝在Hadoop的主節點上?
- 10. 無法在本地ubuntu集羣上部署kubernetes和DNS(所以一個節點)
- 11. 如何在Hadoop的Mapper和Reducer中提供子類?
- 12. 是否需要爲Firebase部署雲端功能所需的節點
- 13. 多節點hadoop集羣和在hados上運行hadoop有什麼區別?
- 14. Hadoop Mapper中Mapper/Reducer的設置和清理方法MapReduce
- 15. 在hadoop集羣上監控有節點的磁盤I/O
- 16. 是否可以將屬性從mapper傳遞給hadoop中的reducer?
- 17. 主節點如何啓動hadoop集羣中的所有進程?
- 18. 如何在Hadoop 1.0.4中鏈接mapper/reducer?
- 19. 運行在Hadoop(單節點集羣)
- 20. 我們是否需要在所有數據節點上安裝spark worker節點?
- 21. Mapper和Reducer是Hadoop版本2中的接口?
- 22. 在羣集上運行Hadoop中的Reducer異常
- 23. Hadoop集羣中的節點數量
- 24. 更改hadoop羣集中節點的FQDN
- 25. Hadoop的多節點集羣設置
- 26. Hadoop集羣是否有docker編排
- 27. 單節點羣集在多節點羣集上工作?
- 28. Hadoop單節點集羣設置問題
- 29. 將Hadoop配置爲多節點羣集
- 30. 自動設置多節點Hadoop集羣