我已經通過了很多關於stackoverflow的博客和apache wiki來了解映射器在Hadoop中的設置方式。我也經歷了[hadoop - how total mappers are determined [此]帖子。 有人說它基於InputFormat,有些帖子說它是基於輸入文件ID分成的塊數。設置所需號碼的映射器
一些我對默認設置感到困惑。
當我運行一個wordcount示例時,我看到映射器低至2.設置中發生了什麼?也是這篇文章[http://svn.apache.org/repos/asf/hadoop/common/trunk/hadoop-mapreduce-project/hadoop-mapreduce-examples/src/main/java/org/apache/hadoop/examples/QuasiMonteCarlo.java] [示例程序]。在這裏,他們根據用戶輸入設置了映射器。如何手動執行此設置?
我真的很感謝一些幫助和理解mappers如何工作。
在此先感謝
你好@Sam:感謝您的回答。我明白基於mapred.min.split.size決定映射器的數量,但我的輸入大小非常小,以至於這種方法並沒有真正的幫助。我找到了一個方法,可以根據InputFormat來決定,在哪裏可以更靈活地設置它[示例](http://www.philippeadjiman.com/blog/2009/12/20/hadoop-tutorial-series-issue -2-工具入門 - 用定製的分區/)。謝謝 – user3560220
@ user3560220好吧,我c,我已經更新了答案。 – samthebest
謝謝samthebest – user3560220