提前道歉,因爲我是新來的火花。我創建了一個具有4個工作站的獨立模式的Spark集羣,並且在成功配置工作站屬性後,我想知道如何配置主屬性。在火花集羣中配置主節點
我寫一個應用程序,並使用它SparkSession.builder連接到集羣(我不希望它使用火花提交提交。)
我知道,工人可以在conf/spark-env.sh
文件中配置並具有可以設置的參數,如'SPARK_WORKER_MEMORY'和'SPARK_WORKER_CORES'
我的問題是:如何配置主設備的屬性?因爲此文件中沒有「SPARK_MASTER_CORES」或「SPARK_MASTER_MEMORY」。
我想過在spark-defaults.conf
文件中設置這個,但是它似乎只用於spark-submit。
我想過在應用程序中使用SparkConf().set("spark.driver.cores", "XX")
來設置它,但是這隻能指定應用程序使用的內核數量。
任何幫助將不勝感激。
謝謝。
如果你不想使用火花提交你怎麼打算將作業提交到集羣? – dumitru
我的腳本在一個連接到火花簇的jupyter筆記本中。 – msharky