2012-07-23 33 views
2

我想創建一個Hadoop作業並在EC2 Map Reduce上運行它。 另外我想在上傳到EC2之前在本地運行此作業。Amazon(EMR)使用哪個Hadoop版本?

我應該在本地使用哪個版本的Hadoop?我可以使用Cloudera VM嗎? Amazon使用哪個Hadoop版本?

+0

哈哈我現在正在做同樣的事情。我認爲.17和cloudera具有專門用於ec2的hadoop的dist。快樂狩獵。 – 2012-07-23 17:53:19

回答

1

Amazon Elastic MapReduce支持Hadoop 0.18,0.20和0.20.205(http://docs.amazonwebservices.com/ElasticMapReduce/latest/DeveloperGuide/EnvironmentConfig_AMIVersion.html#ami-versions-supported)。

您可以指定要運行哪一個。你不能選擇Cloudera;您可以在EC2上運行原始實例並設置您自己的Cloudera集羣。

本地運行與EMR無關;只需以僞分佈式模式設置Hadoop集羣進行測試即可。