我明白爲什麼中間鍵值按鍵分組,但爲什麼要分類?爲什麼要將map reduce中生成的中間鍵排序?
3
A
回答
1
這就是它如何實現分組。當按鍵排序時,它們被分組在一起。它的分類真的沒關係......它只是重要的是相等的鍵是彼此相鄰的。
有可能排序不是最好的方法。也許某種散列會更快:O(N)而不是O(NlogN)。它是作爲排序實現的,因爲有一些應用程序想要排序的鍵(例如HBase/BigTable)。
最近可以使用可插拔排序,並且可以在測試版中使用。我還沒有機會嘗試它。 http://hadoop.apache.org/docs/stable/hadoop-mapreduce-client/hadoop-mapreduce-client-core/PluggableShuffleAndPluggableSort.html
1
我們保證一個給定的分區中,中間鍵/值對以遞增鍵順序進行處理。這種排序保證可以很容易地爲每個分區生成一個排序的輸出文件,當輸出文件格式需要支持通過密鑰進行有效的隨機訪問查找時,或輸出的用戶發現排序數據方便時,這非常有用。
Hadoop已經基於谷歌的論文實施。並非所有算法都需要對數據進行排序。排序已經可以在Hadoop中插入,並且可以使用替代項。更多信息here。
相關問題
- 1. 的map-reduce排序
- 2. MongoDB中的map-reduce降序排序
- 3. Map-Reduce中的二級排序
- 4. 使用Map Reduce生成序列號
- 5. 如何在map/reduce中實現排序和排序?
- 6. getInformation(),Map和Reduce方法在Map/Reduce Script中的用法是什麼?
- 7. MongoDB的Map/Reduce排序工作嗎?
- 8. 在地圖中排序reduce
- 9. 什麼是確切的Map Reduce WorkFlow?
- 10. map-reduce代碼的輸出是什麼?
- 11. 爲什麼MultipleOutputs不適用於此Map Reduce程序?
- 12. 在MongoDB中使用同一個鍵調用多次Reduce map-reduce
- 13. Map Reduce分析時間序列
- 14. Couchdb map/reduce返回流中的第一個,然後按時間排序
- 15. 的Hadoop的Map Reduce程序
- 16. MongoDB。 Map-Reduce完成功能
- 17. 完成MongoDB Map-Reduce步驟
- 18. CouchDB中的map-reduce函數
- 19. Java中的Typesafe map-reduce
- 20. 在MongoDB中限制和排序內聯Map/Reduce
- 21. 是否可以爲map-reduce生成多個輸出文件?
- 22. Hadoop Map Reduce - 如何將分組和排序分開?
- 23. 爲排序後的值生成排序的鍵
- 24. reduce()方法中鍵的輸入順序是什麼
- 25. 什麼是最簡單的解釋什麼是Hadoop和Map/Reduce?
- 26. 在MongoDB中學習Map-Reduce
- 27. 在javascript中使用map reduce
- 28. Map Reduce:爲什麼需要指定「python」之前管道到.py文件?
- 29. 當我們執行Map和Reduce操作時,爲什麼會發生JavaScript鎖定?
- 30. ES6中的Map類需要什麼?