我最近在學Spark,但我對Spark配置有點困惑。 AFAIK,至少有3種方式配置:通過環境變量,命令行參數或代碼設置Spark配置?
- 環境變量,http://spark.apache.org/docs/latest/spark-standalone.html
- 的命令行參數,如
./bin/spark-submit --class <main-class> --master xxx --deploy-mode xxx --conf key=value
- 代碼,像斯卡拉/ Java代碼。
爲什麼有這麼多的方式來做到這一點,有什麼區別?對此有最佳做法嗎?
這是一個grate的解釋,所以:source code - application config;命令行 - 爲運行指定; env var - 硬件/環境 –