2015-10-18 99 views

回答

15

Dataproc在YARN上運行Spark,因此您不會找到典型的「Spark獨立」端口;相反,當運行Spark作業時,您可以訪問端口8088,它將向您顯示YARN ResourceManager的主頁面。任何正在運行的Spark作業都可通過該頁面上的Application Master鏈接進行訪問。 Spark Application Master的頁面看起來與熟悉的Spark獨立登錄頁面相同,您通常可以在端口8080上找到默認的Spark設置。

由於工作人員通過內部網絡進行檢查,YARN的鏈接將使用集羣內部主機名(主機名應包含Dataproc集羣名稱作爲前綴),但這意味着如果您從外部網絡訪問,鏈接起初可能不起作用;如果您使用基於防火牆的方法,則必須使用外部IP地址替換主機名。

更簡單的體驗將是使用SOCKS代理方法,因爲這裏說明:https://cloud.google.com/dataproc/cluster-web-interfaces

在這種情況下,簡單地使用gcloud compute ssh運行輕量級的本地SOCKS代理,然後打開瀏覽器指着,讓你點擊所有的YARN鏈接都是正常的。

+0

已完成作業的Spark UI也將在作業條目的「歷史記錄」鏈接下提供。 – cerisier

相關問題