我在hadoop集羣上運行Hive作業。我只是開始知道,如果你只專注於不同的行爲映射器和減速器,性能將得到改善/改變。但直到我還沒有玩過它。直到沒有我玩過Hive並使用默認的mapper和reducer執行查詢?在hadoop中執行作業時如何設置Mapper和Reducer以及如何決定?
正如我所瞭解的mapper和reducer一樣,我很擔心要設置mapper和reducer的值,以使性能得到改變。我也認爲它只需要設置爲主節點,或者我們必須爲所有節點設置?
任何有想法的人都可以解釋一下我的情況。
另外我們在執行作業時需要設置哪些其他參數?
你的意思是設置映射器和減壓器多少? –
是。其實我試圖設置它,但它並沒有反映在各自的工作XML文件。每個作業創建它自己的XML文件。糾正我我錯了。我檢查我的日誌,我找到了所有的環境變量,我hadoop設置在各自的XML中。 在哪裏觸發te命令來設置這些變量(設置mapred.map.tasks,.....)? am設置在/home/hadoop/hive-0.7.1/bin/hive -e'set mapred.map.tasks'?它是否正確? –