0
我目前有一個hadoop命令,我想使用AWS SDK進行復制。使用其他文件以及EMR流式傳輸步驟?
我目前使用
hadoop jar /home/hadoop/contrib/streaming/hadoop-streaming.jar -input /no_dups -output /sorted -mapper mapper.py -reducer reducer.py -file mapper.py reducer.py other_file1.py other_file2.py
至於我能看到的命令時,StreamingStep
類不提供一種方法,讓Hadoop的知道其他文件,將需要與映射器和沿減速器。
是此功能是否可用?