0
在配置單元中,爲什麼桶的數量應該等於reducer的數量?爲什麼配置單元中的桶數應該等於reducer數?
在配置單元中,爲什麼桶的數量應該等於reducer的數量?爲什麼配置單元中的桶數應該等於reducer數?
因爲這是最優化的mapreduce工作方式(其他都相同)。任務將在減速器中分配。
在hive 0.x和1.x中,您必須指定以下內容:hive.enforce.bucketing = true。這意味着reducer的數量將根據您表中桶的數量自動確定。在更高版本的配置單元(2.x)中,這是默認設置。
來源:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL+BucketedTables