繼續問題:What is the difference between partitioning and bucketing a table in Hive ?蜂巢桶vs分區
假設我們已通過Salary列對員工表進行分區。如果我們使用基於salary列的where子句中的條件從此表編寫select查詢,那麼查詢將運行得很快......因爲它只會從特定分區獲取細節。
但是,如果我們根據薪水欄和固定桶數設置相同的表格,而不是分區。那麼在這種情況下,如果我們編寫相同的查詢,我想知道該查詢如何從桶中受益?任何人都可以解釋嗎?