Q

hadoop mapreduce兩種

2016-04-03 122 views 0 likes

0

我是Hadoop mapreduce的新手。我瀏覽了一些教程，並注意到mapper的輸出在reducer一側進行排序，我們也有一個洗牌&排序階段。hadoop mapreduce兩種

那麼，爲什麼我們有兩種？他們的目的是什麼？

謝謝！

2016-04-03 milodky

A

回答

0

映射器：它將來自源的輸入數據排列成鍵值對以供進一步處理。

減速器：聚合邏輯寫在這裏。

Shuffler的作用是混洗和排序，它將輸出從映射器傳遞到reducer.This由MR框架內部完成。但是，我們可以使用MR Api和Java實現自己的自定義混洗器。

參考字計數的這個例子：

http://kickstarthadoop.blogspot.in/2011/04/word-count-hadoop-map-reduce-example.html 也可以參考這個。 https://hadoop.apache.org/docs/r1.2.1/mapred_tutorial.html

2016-04-04 12:06:40 TKHN

+0

感謝@TKHN爲您解答。我想知道對mapper的輸出進行排序有助於將key-value對發送到右縮減器，而reducer對鍵值對進行排序以更快地對它們進行分組，對嗎？ – milodky

相關問題

1. hadoop mapreduce
2. 比較Hadoop MapReduce中的兩個文件
3. Hadoop Mapreduce wordcount
4. Hadoop mapreduce編程
5. hadoop mapreduce model java
6. Hadoop和MapReduce
7. hadoop mapreduce teragen FAIL_CONTAINER_CLEANUP
8. 在hadoop mapreduce
9. hadoop的Dumbo mapreduce
10. Hadoop Mapreduce ClassNotFoundException

11. Hadoop MapReduce思維
12. Hadoop中的MapReduce
13. Hadoop MapReduce appcache目錄
14. mapreduce中的reducers hadoop
15. NoClassDefFoundError：org/json/JSONObject - Hadoop MapReduce
16. Hadoop MapReduce DBInputFormat和DBOutputFormat
17. MapReduce Apache Hadoop技術
18. Hadoop Maven依賴MapReduce
19. Hadoop MapReduce多輸入
20. Hadoop MapReduce中的DataJoins
21. Hadoop mapreduce - reducer未運行
22. Hadoop MapReduce中間輸出
23. 大廈的Hadoop MapReduce的
24. Hadoop MapReduce，Java執行問題
25. 的Hadoop MapReduce的錯誤
26. Hadoop MapReduce InputFormat已棄用？
27. Hadoop MapReduce不寫輸出
28. 的Hadoop MapReduce的用java
29. 的Hadoop MapReduce的2.5.1凍結
30. Hadoop MapReduce負載平衡