如果我增加了mappers的數量並減少了reducers的數量,那麼在執行時任何作業的性能(增加/減少)是否有差異?如何根據用於提高性能的實例數量增加hadoop中的映射器和reducers?
另外我想問一下如何設置mappers和reducer的數量?我從來沒有玩過這個設置這就是爲什麼我不知道這個。我知道hadoop,但我有代碼,因爲我使用Hive很多。
此外,如果我想增加mappers和reducer的數量,那麼如何設置它,並確定我設置它的值。它取決於實例的數量(例如10)?
請回復我我想試試這個並檢查性能。 謝謝。
感謝大衛的回答。但是我想知道如何設置mapper和reducer(設置它的命令是什麼?)。 –
最簡單的方法是設置以下屬性:Mapred-site.xml中的mapred.tasktracker.map.tasks.maximum和mapred.tasktracker.reduce.tasks.maximum –