TL; DR:在Spark Standalone集羣中,客戶端和集羣部署模式之間有什麼不同?如何設置我的應用程序將運行在哪個模式?Spark Standalone:客戶端和集羣部署模式之間的區別
我們有三個用機火花獨立集羣,它們都與星火1.6.1:
- 主計算機,這也正是我們的應用程序正在使用運行
- 2相同的工人機
從Spark Documentation,我讀:
(...)對於獨立羣集,Spark當前支持兩種部署模式。在客戶端模式下,驅動程序在與提交應用程序的客戶端相同的進程中啓動。然而,在集羣模式下,驅動程序是從集羣內的其中一個Worker進程啓動的,客戶端進程在完成其提交應用程序的責任時立即退出,而無需等待應用程序完成。
但是,通過閱讀本文,我不太瞭解實際差異,我不明白不同的部署模式有哪些優缺點。
此外,當我使用開始提交,即使我設置屬性spark.submit.deployMode
到「集羣」開始我的申請,我的背景下,星火UI顯示以下條目:
所以我我無法測試兩種模式以查看實際差異。話雖這麼說,我的問題是:
1)什麼是星火獨立客戶部署模式和集羣部署模式之間的實際差異?什麼是使用每一個的專業人士和騙子?
2)如何使用來選擇我的應用程序正在運行的哪一個?
我注意到的一點是,驅動程序需要訪問數據,雖然它不會做任何事情。因此,如果您使用文件系統來保留某些文件,則需要在驅動程序節點和羣集上都具有相同的文件。 –
@DurgaSwaroop你指的是哪一種模式? –
在客戶端模式下。 –