2014-10-21 58 views

回答

0

一旦這項工作在亞馬遜EMR創建的,我可以將文件複製到S3,並直接使用-cacheFile選項引用它:

bin/hadoop ... -cacheFile s3://my-bucket/files/cachefile.csv#reference 

在Python然後我可以打開此文件:

with open("reference") as reference_file: 
    references = reference_file.read().splitlines()