2013-06-01 33 views
1

我看到了map/reduce class present @ both org.apache.hadoop.mapred & org.apache.hadoop.mapreduce。我們應該使用什麼,哪個更好? 我看到org.apache.hadoop.mapred已被刪除一次,但已被添加回來/哪個map reduce package要使用

回答

1

org.apache.hadoop.mapred是來自傳統hadoop代碼的包。 org.apache.hadoop.mapreduce是Hadoop 0.20.x的新增功能。

功能上明智的舊的新API沒有太大的區別。唯一重要的區別是記錄被推送到舊API中的映射器/縮減器。而新的API支持拉/推機制。你可以得到更多關於拉機制here的信息。

另外,舊的API已棄用。你可以找到更多關於新的API here的信息。請注意,並非所有東西都從mapred遷移到mapreduce。儘可能嘗試使用新的API。

+0

舊的API不會被刪除,它也遲早不會被推薦(如果它不在2.0.x中)。 –

+0

@ThomasJungblut感謝您的糾正。上面更新了我的答案。 –