impala

    0熱度

    1回答

    創建一個引導作用的黑斑羚的最新版本帕拉的,我可以從2015年找到一個EMR引導作用This one這並安裝因帕拉2.2.0 有一種簡單的方法來更新這2.7還是2.8?旋轉Ubuntu 14.04盒子來構建是一種選擇,但我不清楚如何最終將它安裝在EMR集羣上。

    -2熱度

    1回答

    我有一個黑斑羚查詢聚合數百萬條記錄到許多colums使用組通過組 select col1, col3, col5, col7, col23 col24, count(*) as count from my_table group by col1, col3, col5, col7, col23 col24 結果: col1, col3, col5, col7, col23 col24, c

    0熱度

    1回答

    我想在Hadoop上對Cloudera Impala中的python impyla查詢中的字符進行轉義,但似乎沒有任何工作..模板語法不能轉義(對於數據庫API ..) cursor.execute('SELECT * from table where col1 = %s', tuple(["John's unescaped string"])) 產生一個錯誤。 即使 cursor.execu

    1熱度

    1回答

    選擇下一個非空字段我有6場,看起來像這樣的表: Field1 Field2 Field3 Field4 Field5 Field6 ABC 45 XYZ JKL BNM 65 QWE JKL WER YUI IOP GHJ 我想從該表中提取數據到以上5個領域,我們忽略了一個新的表空值。我最後的表應該是這樣的: Result1 Result2 Result3 Re

    0熱度

    1回答

    我最近在三節點MapR羣集上安裝了Impala。當我運行一個簡單的查詢時,性能不如Impala + HDFS。以下是查詢: SELECT * FROM ft_test, ft_wafer WHERE ft_test_parquet.id = ft_wafer_parquet.id and month = 1 and day = 8 and param = 2913; 花了大約3秒。但

    0熱度

    1回答

    在因帕拉pst轉換一些我得到不正確的數據,同時從UTC轉換爲PST.When時間戳我在蜂巢上運行相同的查詢,我得到正確的數據,但在黑斑羚PST轉換是沒有做正確的一些日期。 帕拉: select from_utc_timestamp('2006-08-30 08:00:00','PST') 2006-08-30 01:00:00 蜂巢: select from_utc_timestamp('2

    1熱度

    1回答

    1)從執行的 https://www.cloudera.com/downloads/connectors/impala/jdbc/2-5-37.html 2)下載的驅動程序帕拉3​​7年2月5日: call apoc.load.driver("com.cloudera.impala.jdbc4.Driver") 任何錯誤。 3)執行的: CALL apoc.load.jdbc("jdbc:impa

    -1熱度

    1回答

    目前,我們正在使用傳統數據倉庫ETL工具IBM DataStage。我們希望遷移這些工作。這些工作主要包括連接和轉換來派生事實表。哪種技術可以更好地遷移這些工作?我們在使用ETL的Impala查詢時使用hue oozie,我們是否應該將spark sql用於ETL而不是Impala查詢?

    0熱度

    1回答

    我想在PySpark中構建一個模型。並輸入此模型形成impala.PySpark可以連接嗎?謝謝!

    0熱度

    1回答

    我組成了一個簡單的左連接hiveql select * from a left outer join b on (a.f1=b.f1 and a.f2=b.f2) 以上查詢結果總數爲798,608。 但是,表a中的記錄總數是780,499,它不匹配。 我試圖找到只存在於左連接結果但不在表a中的所有記錄;結果返回空白。 我甚至試圖用少量記錄創建2個小表(a'和b'),左連接結果的計數與表a'記錄的計