2015-04-19 40 views

回答

3

映射器的數量取決於由jobclient計算的輸入拆分的數量。

而且配置單元查詢就像是一系列Map縮減作業。如果您編寫一個簡單的查詢,如select Count(*) from Employee只會執行一個Map reduce程序。如果您提供包含大量聚合和連接等的複雜查詢,則將執行一系列Map Reduce程序,該程序將較早的MR階段輸出用作下一個MR階段的輸入,並將最終結果轉儲到HDFS中。

減速的數量可以通過開發者在蜂巢殼牌被設置爲mapred.reduce.tasks = X

+0

你能告訴我一些文檔/ archtechture或過程圖。這樣我可以更好地理解內部工作的蜂巢查詢。 – techprat