1
A
回答
0
map任務的個數等於輸入的號碼拆分任何工作,你可以找到發現映射器,你可以設置明確減速的數數它們中的任何一個。此外,一旦您運行map reduce作業,您可以觀察生成的日誌以查找作業中的mappers和reducers的數量。
2
這是不可能得到的地圖的實際數量和減少任務執行之前的應用程序中,由於任務失敗,隨後重新嘗試和推測執行的嘗試的因素不能在執行之前被精確地確定,近似數字任務可以派生出來。
MapReduce作業的Map任務總數取決於其輸入文件及其FileFormat。
對於每個輸入文件,都會計算拆分並調用每個輸入拆分的一個映射任務。
分割尺寸將根據被計算,
input_split_size = max(mapreduce.input.fileinputformat.split.minsize, min(mapreduce.input.fileinputformat.split.maxsize, dfs.blocksize))
如果屬性
mapreduce.input.fileinputformat.split.minsize
mapreduce.input.fileinputformat.split.maxsize
處於其默認狀態下,輸入分割尺寸要文件將近似等於其
blocksize
考慮到文件是可拆分的。
的映射任務的總數將等於求和輸入的數的每個文件分割。
減少任務的總數,它是1
(默認)或等於mapreduce.job.reduces
。
2
的數映射器依賴於HDFS的文件塊大小(默認)和輸入分配大小(如果我們爲非默認指定)。
如果假設你有128MB的文件是存在的,HDFS塊的大小爲64MB然後一個數字地圖的任務將是2,因爲默認行爲。
如果您的輸入分割大小爲32MB,但hdfs塊大小爲64MB,那麼地圖任務的那個時間數將爲4.因此,地圖任務取決於上面定義的全部三個因子。
減少任務的數量取決於
conf.seNumReduceTask(num)
或mapreduce.job.reduces
(mapred.reduce.tasks
已棄用)。
相關問題
- 1. 集裝箱MapReduce任務的
- 2. MapReduce:增加併發映射器任務的數量
- 3. 瞭解Hadoop中map和reduce任務的數量MapReduce
- 4. MapReduce中1個任務的縮減器數量
- 5. MapReduce不足夠的任務是什麼?
- 6. MongoDb - 重新加入拆分mapreduce任務
- 7. MapReduce程序圖任務超時
- 8. mapreduce任務只能在namenode上運行
- 9. Hadoop:在連續的mapreduce任務之間傳遞數據
- 10. MapReduce的地圖任務共享輸入數據
- 11. 是否可以用一個reducer執行任何mapreduce任務?
- 12. Mapreduce程序的mappers的數量
- 13. 等待任務數量可能不同的任務
- 14. 等待未知數量的任務,然後阻止任何新的任務
- 15. Spark中每個任務的CPU數量
- 16. 設置地圖任務的數量
- 17. System.Threading.Tasks - 限制併發任務的數量
- 18. 是否有任務數量的限制?
- 19. 確定適當數量的任務
- 20. gcd:控制並行任務的數量
- 21. rake任務中的增量參數
- 22. Reducer任務未在我的MapReduce作業中調用
- 23. 在僞分佈式hadoop中並行運行的Mapreduce任務
- 24. 增量MapReduce的在C#.NET
- 25. Hadoop如何在多個數據節點上分發數據和mapreduce任務
- 26. 什麼類型的任務/應用程序可以使用Apache Hadoop(MapReduce函數)
- 27. 當mapreduce任務完成多個輸入文件時,hadoop如何修復mappers或Input splits的數量?
- 28. rake任務變量
- 29. MapReduce批量更新數據存儲
- 30. 等待大量的任務
你的工作的計數器將顯示在作業中使用的映射器和減速器的實際數量 –