僅僅是減速階段的工作？

在Hadoop MapReduce中，中間輸出（地圖輸出）保存在本地磁盤中。我想知道是否可以在reduce階段開始一項工作，從本地磁盤讀取mapoutput，對數據進行分區並執行reduce任務？僅僅是減速階段的工作？

2015-11-10 xeon123

Mapper的一個基本實現叫做IdentityMapper，它基本上將所有的鍵值對傳遞給一個Reducer。

你不能只運行異徑沒有任何映射器..

2015-11-10 19:56:26 hadooper

我無法找到身份映射器的任何實例。我使用了Google，或者使用github。你能指點我嗎？ – xeon

映射reduce對HDFS中的數據起作用。所以我不認爲你可以寫Reducer only map reduce從本地磁盤讀取

2015-11-10 18:15:27 Ramzy

如果你使用Hadoop的數據流，你可以添加：

-mapper "/bin/sh -c \"cat\""

2017-04-21 15:04:27

回答