我試圖在亞馬遜雲上進行設置以運行一些hadoop MapReduce作業,但我努力成功地創建一個集羣。我已經下載了ec2文件,有我的證書和密鑰對文件,但我相信這是AMI導致我的麻煩。如果我試圖運行帶有主節點和n個從節點的羣集,則使用標準兼容AMI啓動n + 1個實例,然後在終端中運行代碼「hadoop-ec2啓動羣集名稱n」。主節點成功,但從節點開始啓動時出現錯誤,說「缺少參數-h(缺少AMI)」,但我不完全確定如何進展。亞馬遜雲上的Hadoop
此外,我的一些工作將需要改變hadoops參數設置(特別是mapred-site.xml配置文件),是否有可能改變這個文件,如果有,我該如何獲得訪問權限? hadoop已經安裝在亞馬遜機器上了,這個文件可以訪問和修改嗎?
感謝
首先我使用了我能找到的任何AMIs。我在終端上運行一段代碼,比如「ec2-describe-images -o amazon」,然後選擇AMI工作的任何一個;然後使用「ec2-run-instances amixxxxxx -n 5 -k keypair」啓動具有此AMI的實例,最後嘗試啓動具有「hadoop-ec2啓動集羣名稱4」的集羣(這是針對具有4個從集羣的集羣節點)。說實話,我對雲很陌生,並不知道自己在做什麼。 –
我希望改變的參數是hadoop的工作參數,如io.sort.mb(用於在映射和縮小階段之間進行排序的緩衝區內存量)等...它們通過更改文件(mapred -site.xml)存儲在hadoop文件夾中。 –
@Jonathan Viccary好的,我看到,您正在使用Hadoop的src/contrib/ec2/bin中的「hadoop-ec2」腳本。如果你想以這種方式啓動hadoop集羣......我看了看腳本,發現它自動啓動實例 - 你不必手動調用ec2-run-instances。但你必須配置它:http://wiki.apache.org/hadoop/AmazonEC2#Setting_up –