我正試圖在Amazon EC2上永久設置Hadoop。目前我所做的是每天早上啓動EC2實例並設置Hadoop。有什麼辦法可以避免這個乏味的步驟嗎?我正在尋找一個可以在EC2上加載的Hadoop映像,並使我的工作變得簡單。我在哪裏可以找到EC2上的Hadoop的AMI?
我知道我可以將EMR用於hadoop服務。但我不知道如何在不提交工作流的情況下啓動EMR(hadoop)集羣。我的意思是我需要一個沒有任何作業的hadoop集羣。
最終我的目標是運行生物信息學應用程序,如Distmap和Seal。爲了運行這些應用程序,有許多依賴關係。所以我需要一個免費的hadoop集羣來設置環境,然後運行這些應用程序。 我希望它清楚我想要做什麼。
謝謝。
有趣。我認爲這對我來說是一個好開始.. – Ashwin