2016-05-18 40 views

回答

0

從Drill 1.12開始,Drill不利用指數。 Drill只是假設沒有索引並且吸引所有數據,並且以天真的方式進行計算。有一些工作可以充分利用像Hive這樣的外部系統中的索引知識,但這項工作仍在進行中,尚未成爲Drill版本的一部分。

+1

是的。但公平地說,所有大數據查詢引擎_(Hive,Impala,Drill,Spark ......甚至Oracle Exadata都以某種方式)_具有相同的方法來最小化I/O:依靠(a)分區/分區和b)由諸如Parquet和ORC等柱狀格式支持的「謂詞下推」。 https://drill.apache.org/docs/partition-pruning-introduction/和https://drill.apache.org/docs/parquet-filter-pushdown/ –

+0

Drill確實支持分區文件並執行謂詞下推。但是,它不支持指標(還)。例如,如果您有一個數據庫表,其中列** myCol **和在** myCol **上定義的索引,Drill不會利用索引來執行類似的操作。相反,Drill會吸引表中的所有數據並進行排序,即使在列上定義了索引。 – ilooner

+0

是的,這正是我所說的,沒有關於_「(c)indices」_ ... 0: - ) –