我在AWS EC2上的七個m4.2xlarge Red Hat實例上部署了Hortonworkks數據平臺(HDP2.4)。該羣集具有Spark,並且我正在使用Spark通過與Tableau進行連接來查詢。我被問及查詢速度,我不知道如何估計查詢速度。我應該考慮哪些因素,還是有直接瞭解火花集羣查詢速度的方法?火花集羣的查詢速度
0
A
回答
0
我正在做同樣的分析。呈現tableau報告時速度似乎很慢。因此,爲了分析速度,您需要查看將Tableau連接到Spark羣集的日誌。
在我們的案例中,它是Thrift Server 2,日誌位於:/var/log/spark/spark-root-org.apache.spark.sql.hive.thriftserver.HiveThriftServer2-<<ip>>.out
,您將在日誌名稱的末尾有一個IP地址。
當您查看日誌時,您將看到INFO SparkExecuteStatementOperation: Running query
和查詢。對於儀表板執行的查詢太多了。
你可以得到一個高層次的想法。如果您想深入分析,請查看EMR集羣詳細信息頁面中的資源管理器中的Thrift Server階段。在資源管理器中,您將能夠看到正在用於查詢的容器。
或者,您可以在Spark上執行相同的查詢並運行它,並查看它的執行方式。
相關問題
- 1. 火花獨立羣集
- 2. 監控AWS EMR中的火花集羣,無火花UI
- 3. 火花速度性能
- 4. 帶有火花的AWS DataPipeline EMR集羣
- 5. 火花紗羣集權限問題
- 6. 火花集羣是什麼意思?
- 7. 在紗線集羣上安裝火花
- 8. 火花劃分/集羣執行
- 9. 在火花集羣上安裝python CV2
- 10. 火花提交時覆蓋集羣URL
- 11. CountWord在集羣azure上使用火花
- 12. 火花紗羣集預安裝
- 13. 帶火花的查詢mongodb
- 14. 提高火花應用的速度
- 15. 帶火花的速度模板引擎
- 16. 從火花傳遞到速度
- 17. ResourceNotFoundException:用於火花java和速度
- 18. 通過碼頭羣組模式部署火花羣集
- 19. 獲得集羣和集羣的第一要素IDS k均值火花
- 20. couchbase集羣的讀寫速度
- 21. 火力查詢和迅速
- 22. 查詢速度
- 23. 紗線和集羣模式下的打印火花命令
- 24. 如何正確提交火花的作業單機集羣
- 25. snappy-data與預先構建的現有火花集羣
- 26. 如何在羣集中執行高效的火花程序
- 27. 從外部局域網使用火花集羣的問題
- 28. 在集羣模式下使用地圖的火花
- 29. 火花StreamingListener CloudWatch的集成
- 30. 火花標籤的寬度