1
我有一個關於在黑斑羚數據局部性問題, 可以說我有10個數據節點的集羣(每個數據節點上有impalad), 如果我在黑斑羚SELECT * FROM big_table where dt='2017' where blabla orderby blabla group by blabla
執行查詢(可以說,它是一個大的查詢)。帕拉數據局部性
,並讓說,在分區中的文件(DT = 2017' 年)是DN 1,3,5 所以如果我執行查詢將協調只能使用數據局部性或者守護進程1,3,5將使用所有的守護進程,其他守護進程將遠程讀取這些數據?