2
我有以下情形:運行EMR集羣外星火客戶端和連接到YARN
- 我在一家大公司工作。
- 我們有一個運行在YARN上的Spark/Hadoop堆棧的EMR集羣。
- 我可以通過SSH連接到集羣的主節點,然後從那裏創建Spark shell或者Spark任務,並將其提交給Spark集羣,沒有任何問題。
- 但是,我想在我公司的服務器上運行Spark客戶端,因爲我們的所有代碼庫都位於那裏,因此我有能力在該服務器上進行主動開發,因爲我可以克隆並推送到位於該服務器上的存儲庫在我公司的服務器上。我不想將所有的公司代碼轉移到AWS的主節點上進行主動開發。
- 那麼,如何修改Spark設置以使用AWS的YARN作爲資源管理器?
- 我試圖從EMR集羣的主節點將Spark安裝(在
/user/lib/spark
)和HADOOP_CONF_DIR
(在/etc/hadoop/conf
)複製到我公司的服務器,但Spark不識別YARN。
謝謝。
修改:在主題行和正文中將'driver'更改爲'client'。