我最近在三節點MapR羣集上安裝了Impala。當我運行一個簡單的查詢時,性能不如Impala + HDFS。以下是查詢: SELECT *
FROM ft_test, ft_wafer
WHERE ft_test_parquet.id = ft_wafer_parquet.id
and month = 1
and day = 8
and param = 2913;
花了大約3秒。但
我組成了一個簡單的左連接hiveql select * from a left outer join b on (a.f1=b.f1 and a.f2=b.f2) 以上查詢結果總數爲798,608。 但是,表a中的記錄總數是780,499,它不匹配。 我試圖找到只存在於左連接結果但不在表a中的所有記錄;結果返回空白。 我甚至試圖用少量記錄創建2個小表(a'和b'),左連接結果的計數與表a'記錄的計