2
A
回答
1
我認爲這是不可能的,因爲內部映射減少得到執行的任何特定的Hive查詢。而且映射減少作業的執行時間取決於羣集負載及其配置。所以很難預測執行時間。也許你可以在運行查詢之前做一件事情,你可以使用一些計時器,然後在完成之後你可以計算執行所需的確切執行時間。
0
也許您可以使用分區,存儲桶功能等從表格中抽取一小部分記錄,然後針對小數據集運行查詢。記下執行時間,然後乘以因子(total_size/sample_size)。
2
目前沒有OOTB功能可以實現此功能。實現這一目標的一種方法是從歷史中吸取教訓。根據以前運行的類似數據和查詢收集模式,並嘗試推斷出一些見解。您可能會在此過程中找到像Starfish這樣的工具。
我不建議你根據數據子集來決定任何事情,因爲在小數據集和實際數據集上運行查詢是非常不同的。這對測試功能很好,但不適合任何成本近似。其原因是系統資源(磁盤,CPU插槽,N/W等),系統配置,其他正在運行的作業等過程中涉及很多因素,您可能會在小數據集上找到平滑操作,但隨着數據量的增加,所有這些因素開始發揮非常重要的作用。即使是一個小配置參數也可能扮演重要角色(您可能有時會注意到Hive查詢最初運行速度很快,但逐漸變慢)。此外,執行Hive查詢比簡單的MR作業涉及更多。
相關問題
- 1. 配置單元查詢花費無限多的時間執行
- 2. 配置單元查詢BlockMissingException
- 3. 從遠程機器執行長時間運行的配置單元查詢
- 4. 長時間運行查詢
- 5. 如何在時間單個查詢運行2個查詢
- 6. 查詢日期VS查詢的時間
- 7. Linq查詢不能按預期運行
- 8. 查詢不按預期運行
- 9. Hibernate查詢執行時間超過預期時間
- 10. 查找MySql查詢運行時間?
- 11. 要使用下面的查詢計算配置單元查詢
- 12. 對MySQL的配置單元查詢
- 13. 如何輸出配置單元查詢時間到文件?
- 14. 長時間運行的查詢超時
- 15. SQL查詢預期';'
- 16. 配置單元查詢性能不佳
- 17. 配置單元查詢傾銷問題
- 18. 查詢多個分區配置單元?
- 19. Presto無法查詢配置單元表
- 20. prestodb配置單元sql查詢錯誤
- 21. 理解配置單元查詢計劃
- 22. 配置單元視圖查詢結果?
- 23. LINQ查詢不按預期查詢
- 24. 調整長時間運行的查詢
- 25. 在特定時間運行的查詢
- 26. 長時間運行的查詢問題
- 27. 如何在預定義的固定時間運行MYSQL查詢?
- 28. 簡單的查詢運行時間比大多數其他查詢長
- 29. 查詢日期時間
- 30. Django日期時間查詢
我非常喜歡這個主意。請讓我們知道,如果你找到一些直接的方式來實現這一點。謝謝。 – Tariq