0
A
回答
0
分區程序不分配記錄減速器隨機,它已預定義的邏輯
當我們編寫自定義分區我們寫的邏輯是如何記錄應減速
例如,如果你正在處理的中分配數據由一個外地的年齡
你可以決定如何您輸入將在減速
首先你必須配置沒有被處理。您想要針對特定作業的減速器可以在地圖減速作業的驅動程序中配置
假設您已配置3個減速器數量。
雖然編寫自定義分區,你將定義邏輯例如
if(ageInt <=20){
return 0;
}
//else if the age is between 20 and 50, assign partition 1
if(ageInt >20 && ageInt <=50){
return 1 % numReduceTasks;
}
//otherwise assign partition 2
else
return 2 % numReduceTasks;
所有這一切都落在類別不到20歲就要去第一減速器的記錄。
甚至在執行作業之前,您可以根據您的情況計算所有記錄數。
相關問題
- 1. 如何提前知道hadoop map中每個reducer的記錄數reduce \根據大小忽略分區
- 2. hadoop reducer的reduce()調用可以記錄的最大記錄數是多少?
- 3. 如何知道記錄是否最後
- 4. Hadoop中的分裂Reducer輸出
- 5. 知道mapper和reducer的用法
- 6. 使用多個reducer時,Hadoop中的鍵/值對如何分佈?
- 7. hadoop streaming:如何給reducer鍵值列表?
- 8. 如何在Hadoop 1.0.4中鏈接mapper/reducer?
- 9. Hadoop Reducer內存中的值?
- 10. Hadoop中的Mapper和Reducer
- 11. 如何處理未分配的記錄
- 12. Hadoop spiled記錄
- 13. 記錄在Hadoop
- 14. 如何根據記錄的部分匹配返回記錄?
- 15. 如何知道新紀錄
- 16. Hadoop mapreduce - reducer未運行
- 17. Hadoop - 在Reducer中排序
- 18. hadoop mapreduce common friends reducer spillage
- 19. CakePHP savefield()不知道記錄的ID
- 20. 如何讓DataPager知道自定義分頁中DataSource中的總記錄數?
- 21. 如何從Hadoop記錄消息?
- 22. Hadoop map-reducer不寫任何輸出
- 23. Hadoop堆分配
- 24. 如何知道Azure數據庫中記錄的存儲地址
- 25. 如何知道來自瀏覽器歷史記錄的頁面
- 26. 如何知道Progress-4GL中程序訪問的記錄數?
- 27. Xcode如何知道我的提交歷史記錄?
- 28. 如何知道使用LDAP在AD中更新的記錄數
- 29. 簡化F#記錄分配
- 30. Rails如何知道何時從`sessions`表中刪除記錄?
謝謝,您的回覆是突破。 – 2014-10-30 07:22:43