我無法獲得以下2個mapreduce作業配置屬性之間的差異。Mapreduce並行副本vs http線程
mapreduce.reduce.shuffle.parallelcopies
mapreduce.tasktracker.http.threads
的mapreduce.reduce.shuffle.parallelcopies是在複製過程中減少由平行轉移的次數(洗牌)階段。
mapreduce.tasktracker.http.threads是http服務器的工作線程數。這用於地圖輸出提取。
parallelcopies表示並行傳輸的數量,我想它會反駁地圖輸出並行傳輸到reducer一次。 http線程表示要在Reducer中運行的http線程的數量來複制映射輸出。
我無法區分這兩個屬性,似乎與我相同,因爲這兩個屬性都與減速器的fetchers數量有關。
請幫助我理解這些屬性的實際意圖以及它們如何提供幫助?