差異

2015-10-23 169 views
0

請讓我知道在Hadoop中的部分排序,總排序和輔助排序的差異差異

回答

2

部分排序: -

的減速機的輸出將很多文件都是基於密鑰在內部進行排序的。

總排序

的減速機的輸出將具有基於鍵排序的所有輸出的單個文件。

輔助排序

在這種情況下,我們將能夠與keys.That是排序可以在兩個或多個字段值來完成沿控制值的排序。

+0

適用於只是map任務這兩部分的分類和排序總的概念? 是否與整個排序相關的次要排序? – Praveen

+0

部分排序和總排序不僅適用於地圖任務......次排序不同於總排序 – madhu

0

部分類別:

N多映射器只會生成文件的N多。 N個reducer將分別對這些文件進行排序。

總排序

從一個特定的密鑰所有鍵值對將達到一個特定的減速器。這將通過Mapper級別的Partitioners發生。 Mapper級別的組合器將充當半縮減器並將特定鍵的值發送給Reducer。

減速機輸出將是一個單一的文件,所有的輸出都根據關鍵字排序。

輔助排序

用於定義地圖的輸出按鍵的排序方式。它適用於Mapper級別。在這種情況下,我們將能夠控制值與鍵的排序。也就是說,排序可以在兩個或多個字段值上完成。

看一看article1article2article3