我有一個map-reduce程序,其中映射器生成多個鍵。根據map-reduce框架,所有具有相同密鑰的對被傳遞給同一個reducer。假設我有10把鑰匙(總計)和3個減速器。減速器最後輸出的是3個輸出文件。是否有任何技術爲每個鍵生成單獨的輸出文件並在最後輸出10個輸出文件?有可能有10個減速器,但是當鍵的數量增加時,這個解決方案可能是不可能的。如何爲減速器中的每個鍵輸出單獨的輸出文件?
0
A
回答
0
這聽起來不是一個很好的主意。一旦你開始使用Hadoop的真實的東西,你將面臨嚴重的問題。
但是,如果您仍然需要它,爲什麼不跳過Reduce階段。直接從Mappers發出輸出,然後是Combiner。
0
相關問題
- 1. 如何使Hadoop減速器爲單個鍵輸出多個值
- 2. 如何爲每個chain_id保存單獨的輸出文件?
- 3. 如何獲得一個單一的鍵值對作爲減速器的輸出
- 4. 減速器中的多個輸出
- 5. 從減速器輸出文件讀取
- 6. 「減速」輸出
- 7. 如何爲每個服務器名稱輸出單獨的CSV文件
- 8. 如何從大型xml文件中爲每個單獨的頁面輸出單獨的pdf/tiff文件?
- 9. 如何在映射器中爲每個輸入記錄輸出一個單獨的文件?
- 10. 每個ROI分析單獨輸出文件中的粒子; ImageJ
- 11. hadoop mapreduce中單獨的輸出文件
- 12. 多個輸出爲一個鍵爲減速功能,Hadoop
- 13. python:打印每個線程的輸出到單獨的文件
- 14. SCSS輸出單獨的文件
- 15. 如何設置自定義分配器中每個減速器的輸出文件數量
- 16. Hadoop的,如何壓縮映射器輸出,但不減速機輸出
- 17. Java:讀取hadoop減速器的輸出文件
- 18. Python:你如何打開一個單獨的輸出文件?
- 19. 分類從減速器輸出的鍵值對
- 20. 減速器不選擇映射器輸出文件
- 21. 的Hadoop:減速機輸出到另一個減速
- 22. 如何將減少輸出文件的輸出重命名爲分區編號
- 23. 在新的MapReduce API Reducer中的每個鍵的輸出文件
- 24. Hadoop減速器原始輸出
- 25. PHP腳本爲每個SQL行輸出單獨的PDF - FPDF
- 26. MapReduce的減速機的輸出錯誤
- 27. 如何單獨的輸出數據
- 28. 如何單獨的文件輸出到指定的目錄cljsbuild
- 29. Scalding限制減速器輸出文件大小
- 30. 有多個減速器在HDFS中創建多個輸出文件
跳過Reduce階段的想法很好。但是,我如何將映射器的輸出寫入文件? –
你不必做任何事情。它的作用類似於使用減速器的情況。只需將減速器的數量設置爲零即可。 – Tariq
我實際上將reducer的數量設置爲零,但最後只有一個輸出文件。任何想法? –