2017-04-13 41 views
0

我寫了一個MapReduce程序(mapper.py和reducer.py)來處理Hadoop中的PageRank問題。如何在Hadoop中迭代MapReduce? (lang:python)

我想迭代MapReduce約10次迭代。我怎樣才能將第一輪MapReduce的輸出轉化爲第二輪MapReduce的輸入?

 1     2       10 
[mapper->reducer] -> [mapper->reducer] -> ... -> [mapper->reducer] -> final result 
+0

阿帕奇星火GraphX具有的PageRank內置 –

回答

0

您可以將job1的輸出作爲輸入鏈接到job2。

inputdir1 - > outputdir1 - > outputdir2 ... - > outputdir9 - > outputdir10