我在筆記本電腦上構建了一個本地羣集(僞模式)。我在哪裏運行不同的mapreduce命令,如我可以像在本地羣集上一樣在EMR上運行作業
hadoop-streaming -D mapred.output.compress=true \
-D mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec \
-files my_mapper.py,my_reducer.py \
-mapper my_mapper.py \
-reducer my_reducer.py \
-input /aws/input/input_warc.txt \
-output /aws/output
現在我必須在EMR上運行它。有兩個選項可以使用,一個是控制檯,另一個是aws cli。我想要像上面那樣運行精確的命令。爲此,我想如果我使用EMR master,那麼我應該可以運行這個命令。這是一種正確的方式,還是有這種進步的缺點?