當使用帶有NEW API和自定義(java)輸出格式或(java)Reducer類未發現問題的Hadoop python流時,會發生類似問題。而舊的API則可以正常工作。使用Hadoop Streaming和New API文件格式時未找到類
即 下面的命令行參數工作文件與舊的API,但有新的API的問題。
-inputformat JavaClassName
-outputformat JavaClassName
-partitioner JavaClassName
-combiner streamingCommand or JavaClassNam
例如,如果你看看這個博客帖子:http://research.neustar.biz/2011/08/30/custom-inputoutput-formats-in-hadoop-streaming/如果你試圖用我曾與當地的Hadoop和AWS EMR問題的新MultipleOutputs(減速)來實現這一點。
有什麼想法?