我使用蜂巢0.12。我爲我的桌子創建了幾個索引。 現在,我該如何告訴Hive使用這些? 目前,我只是寫:蜂巢上的使用指數
set hive.optimize.autoindex=true;
set hive.optimize.index.filter = true;
那是好的,或者我還需要增加其他的東西?
我使用蜂巢0.12。我爲我的桌子創建了幾個索引。 現在,我該如何告訴Hive使用這些? 目前,我只是寫:蜂巢上的使用指數
set hive.optimize.autoindex=true;
set hive.optimize.index.filter = true;
那是好的,或者我還需要增加其他的東西?
與大多數DBMS一樣,您需要通過指定名稱,列和類型來手動創建索引。
有非常有用的例子蜂房的官方文檔在這裏:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Indexing
取決於那種你正在運行的查詢中,索引是由蜂巢查詢重寫引擎使用自動。 - where子句 - group by子句 - 聚集條款
如果你使用像實木複合地板「智能」或SERDE :
具體來說,您可以在使用索引字段看到查詢的性能改進ORCFile,你能告訴我你是否看到手動索引和使用SerDe文件元數據之間的性能差距?
其實,我已經創建了索引。 – Edge7 2014-09-05 08:54:27