需要在amazon EMR bootstrap動作上安裝一些軟件包和二進制文件,但我找不到任何使用它的示例。如何在代碼中的amazon EMR bootstrap動作上安裝自定義包?
基本上,我想安裝python包,並指定每個hadoop節點使用此包來處理s3桶中的項目,這裏是一個示例frpm boto。
name='Image to grayscale using SimpleCV python package',
mapper='s3n://elasticmapreduce/samples/imageGrayScale.py',
reducer='aggregate',
input='s3n://elasticmapreduce/samples/input',
output='s3n://<my output bucket>/output'
我需要使它使用SimpleCV python包,但不知道在哪裏指定此。如果沒有安裝,如何安裝?有沒有辦法避免等待安裝完成,是否有可能將其安裝在某處並引用python包?
聽說過「boto」嗎? – emeth
是的,這就是我從 – KJW