具體來說,我試圖找到一種方法來使用map reduce來計算圖中的最短路徑。我提出的那個似乎需要多輪縮小地圖。但是,迄今爲止我在Hadoop上閱讀的所有文檔似乎都沒有清楚地描述具有多個stage.i.e的運行映射縮減作業。從第一階段取得減速器的輸出,並將其作爲輸入提供給下一階段的映射器。我希望在Hadoop中允許像他的人一樣。迭代映射減少作業。如何減少輸出量並將其輸送到下一個階段?
3
A
回答
2
我在這裏的博客上講述它:
http://codingwiththomas.blogspot.com/2011/04/controlling-hadoop-job-recursion.html
這甚至是圖形算法相關的,你將最終獲得完全相同的代碼。
其基本思想是你有一個計數器,它將會是單個mapreduce步驟中有多少頂點已經更新的度量。然後你一次又一次地安排工作,直到你沒有更新的頂點。
但是,嚴重的是,MapReduce吸引圖算法,使用更好的框架,如Apache Hama。
Apache Giraph對您也有幫助。
0
Steve的回答基本上是正確的。對於每一步,您都將inputformat的輸入目錄設置爲上一步的輸出目錄。根據需要重複此次迭代。但是,對於迭代圖問題,Map-Reduce是一個糟糕的抽象。看看Apache Giraph,這是一個特別爲這些類型的情況而設計的。你會發現你的問題更容易表達,問題的迭代性被照顧好。
0
相關問題
- 1. Mongodb併發映射減少
- 2. C減少輸出
- 3. 如何減少作業輸出數據移動到HBase
- 4. 輸入/輸出流量減少鏈
- 5. 使用Hadoop和HBase減少一個映射然後減少
- 6. Mongodb映射減少與Apache Spark映射減少
- 7. 輸出減少一個密鑰一起
- 8. 多個小文件作爲輸入映射減少
- 9. 並行映射減少Hadoop中的作業
- 10. 減少JUnit的輸出
- 11. 減少Findstr工具輸出
- 12. 我要減少數量字段和減少其數量
- 13. 如何在縮減階段工作時啓動映射階段
- 14. 映射/減少計數的兩階段排序
- 15. WEKA類映射和減少KMeans階段在hadoop上聚類
- 16. 排隊和映射/減少
- 17. MongoDB:映射沒有減少?
- 18. Hadoop YARN作業在地圖0%處減少並減少0%
- 19. Hadoop排序映射並減少鍵值
- 20. 映射並減少返回的NAN值
- 21. 分離Hadoop映射並減少任務
- 22. 如何減少grep命令的輸出?
- 23. 如何減少powershell命令的輸出?
- 24. 如何減少SSRS PDF輸出大小
- 25. 將單個Hadoop映射減少輸出寫入多個S3對象
- 26. 的CouchDB如何映射減少
- 27. 減少代碼。減少一些for-loops到一個python
- 28. 減少輸出多個值的函數
- 29. 如何解決這個迭代python代碼並減少重複?
- 30. Map減少作業生成空輸出文件
該鏈接已損壞。 –
看起來像網站不再有效 – AnujKu