我有一個數據文件,我的任務是使用map reduce從文件的每一行創建一個新的數據,因爲數據是巨大的文件。 例如:該文件包含:expression(3-4 * 7-4),我需要從該表達式(3 + 4/7 * 4)中隨機創建一個新表達式。當我使用map reduce實現任務時,我使用map來執行更改,然後簡化爲僅從mapper接收數據並對其進行排序使用map來完成主要任務是否正確?MapReduce沒有reducer功能
0
A
回答
0
如果您不需要映射結果的排序 - 你設置0降低,(在你的驅動程序代碼做
job.setNumReduceTasks(0);
) 和作業只調用地圖。
0
您的實施是正確的。只要確保從映射器輸出的密鑰都是唯一的,如果您不希望任何恰好相同的表達式組合在一起。
例如,既然你說你有一個龐大的數據文件,有可能是你得到兩個表達式,如3-4*7-4
和3*4/7+4
同時,新的表達式變成是3+4*7-4
的可能性。如果使用表達式作爲鍵,則reducer將只會爲這兩個表達式調用一次。如果您不希望發生這種情況,請確保您爲每個密鑰使用唯一的編號。
+0
好的。謝謝您的回答。 – LAILA
相關問題
- 1. 亞馬遜MapReduce沒有reducer作業
- 2. Hadoop mapreduce - reducer未運行
- 3. hadoop mapreduce common friends reducer spillage
- 4. Reducer類在Hadoop中沒有按預期工作MapReduce
- 5. hadoop-mapreduce reducer-組合器輸入
- 6. 發送多個參數給reducer-MapReduce
- 7. MapReduce作業Reducer中的奇怪行爲
- 8. Reducer中的MapReduce值始終爲1
- 9. Hadoop/Mapreduce Reducer無法正常工作
- 10. MapReduce - reducer發出一行輸出
- 11. 爲什麼Reducer.class在Hadoop MapReduce中不能用作真正的reducer?
- 12. 沒有得到性能的MapReduce
- 13. 在reducer功能中選擇max key
- 14. mapreduce中是否有可以並行執行的非交換reducer?
- 15. Ajax沒有功能
- 16. Redux:只有同步調用允許從reducer功能?
- 17. hadoop:1個映射多個reducer與每個reducer具有不同的功能?可能?
- 18. 有沒有地圖功能?
- 19. mapreduce簡單功能 - 使用python
- 20. 做MapReduce的最佳功能語言?
- 21. 的MapReduce沒有排序
- 22. Reducer沒有寫入Redux存儲
- 23. 調用JavaScript沒有功能?
- 24. 沒有一個組功能
- 25. 功能沒有返回龍
- 26. 功能上沒有的NodeJS
- 27. 沒有Excel的Excel功能
- 28. 功能沒有返回值
- 29. 沒有BIO的ASN1_TIME_print功能?
- 30. 功能沒有定義
如果你想「排序」他們,你必須使用reducer。地圖階段僅轉換您的數據。但從你的描述看,你不需要對結果進行排序? – zsxwing