0
我有一個AWS EMR集羣。我爲該集羣運行程序「samplespark.py」(包含在S3存儲桶中)創建了一個步驟。 samplespark.py創建一個文件,並將一些輸出寫入該文件,或者至少在我的計算機上測試時輸出。當我在AWS EMR上運行samplespark.py時,找不到輸出文件。如何將程序的輸出存儲在Amazon S3中?
如何將輸出文件寫入Amazon S3存儲桶?
我有一個AWS EMR集羣。我爲該集羣運行程序「samplespark.py」(包含在S3存儲桶中)創建了一個步驟。 samplespark.py創建一個文件,並將一些輸出寫入該文件,或者至少在我的計算機上測試時輸出。當我在AWS EMR上運行samplespark.py時,找不到輸出文件。如何將程序的輸出存儲在Amazon S3中?
如何將輸出文件寫入Amazon S3存儲桶?
或者您可以使用minio client aka mc
您可以直接管結果S3存儲爲對象。
$ python samplespark.py | MC管s3/myoutput/output.txt
希望它有幫助。