我可以在Spark獨立模式下的Web UI上詳細查看應用程序執行信息,但是當涉及到紗線時,它就消失了。那麼,當工作在紗線上運行時,我可以在哪裏看到執行信息?紗線上的Spark作業的應用程序執行監控
0
A
回答
0
你可以debug your application,但我想這裏沒有專門的UI。
1
您需要配置火花歷史服務器紗,然後再啓動它
在spark-defaults.conf
文件中添加以下屬性,
spark.eventLog.enabled true
spark.eventLog.dir hdfs://LOCATION/TO/SPARK/EVENT/LOG
spark.yarn.historyServer.address SPARK_HISTORY_SERVER_HOST
spark.history.ui.port SPARK_HISTORY_SERVER_PORT
spark.yarn.services org.apache.spark.deploy.yarn.history.YarnHistoryService
spark.history.fs.logDirectory hdfs://LOCATION/TO/SPARK/EVENT/LOG
然後啓動火花的歷史服務器:
$/PATH/TO/SPARK/sbin/start-history-server.sh
PS我假設Spark已經配置了hadoop/yarn(所以你已經在spark-env.sh中設置了配置文件的位置)
相關問題
- 1. 從Eclipse和Spark上提交Spark應用程序作爲紗線作業上下文
- 2. 紗線客戶端上的Spark執行程序不執行執行程序核心數量配置。
- 3. 在Bluemix上執行Apache Spark SQL的作業的調度程序
- 4. 在啓動執行程序時,Spark上的紗線處理數據位置
- 5. 使用紗線執行作業的步驟
- 6. Spark流作業調度控制執行?
- 7. 在紗線簇模式下運行python spark作業
- 8. 使用遠程SparkContext在紗線上運行點火作業:紗線應用已結束
- 9. Spark SASL不能在紗線上工作
- 10. 從Java應用程序啓動並監控Spark應用程序
- 11. 將紗線羣集配置添加到Spark應用程序
- 12. 紗線 - 執行火花的工作
- 13. 紗線簇上的spark scala csv export
- 14. 減少Apache Spark作業/應用程序的運行時間
- 15. Spark程序來監視執行程序的性能
- 16. Openshift上的應用程序監控
- 17. 在AMAZON EMR上運行紗線應用程序
- 18. 監控Spark作業的內存使用情況
- 19. Spark Scheduler強制執行應用程序
- 20. 在紗線叢集模式下花費Spark應用程序的時間
- 21. Cloudera Manager紗線和Spark UI不工作
- 22. 通過應用程序名稱殺死紗線應用程序
- 23. 如何執行多線程應用程序作爲線程?
- 24. 紗線應用程序主控和容器分配
- 25. 監測線程執行
- 26. 監控應用程序監控Java桌面應用程序的性能
- 27. Spark ETL作業只執行一次mysql
- 28. Apache Spark上的遠程作業(Java)
- 29. 如何控制每個任務/舞臺/作業嘗試的Spark應用程序?
- 30. Spark應用程序中的作業總數
你也可以通過Spark的歷史記錄服務器 http://重建完成的應用程序的UI spark.apache.org/docs/latest/monitoring.html#viewing-after-the-fact – RoyaumeIX
是的,執行歷史可以以這種方式顯示,我試圖找出這個問題。 –