2
我有一些問題來配置hadoop與sparkR爲了從亞馬遜S3讀取/寫入數據。
例如,這些都是在pyspark工作的命令(解決同樣的問題):火花R的Hadoop配置
sc._jsc.hadoopConfiguration().set("fs.s3n.impl","org.apache.hadoop.fs.s3native.NativeS3FileSystem")
sc._jsc.hadoopConfiguration().set("fs.s3n.awsAccessKeyId", "myaccesskey")
sc._jsc.hadoopConfiguration().set("fs.s3n.awsSecretAccessKey", "mysecretaccesskey")
sc._jsc.hadoopConfiguration().set("fs.s3n.endpoint", "myentrypoint")
任何人可以幫助我工作了這一點?
'awsSecretAccessKey'和'awsAccessKeyId'可以使用環境變量進行設置。請參閱:[在EC2上運行Spark](http://spark.apache.org/docs/latest/ec2-scripts.html) – zero323