impala

0熱度

1回答

創建一個引導作用的黑斑羚的最新版本帕拉的，我可以從2015年找到一個EMR引導作用This one這並安裝因帕拉2.2.0 有一種簡單的方法來更新這2.7還是2.8？旋轉Ubuntu 14.04盒子來構建是一種選擇，但我不清楚如何最終將它安裝在EMR集羣上。

-2熱度

1回答

如何獲取SQL中特定分組中的每條記錄（希望通過索引）？

我有一個黑斑羚查詢聚合數百萬條記錄到許多colums使用組通過組 select col1, col3, col5, col7, col23 col24, count(*) as count from my_table group by col1, col3, col5, col7, col23 col24 結果： col1, col3, col5, col7, col23 col24, c

0熱度

1回答

如何在python impyla中查詢運行在Hadoop上的Cloudera Impala中的字符

我想在Hadoop上對Cloudera Impala中的python impyla查詢中的字符進行轉義，但似乎沒有任何工作..模板語法不能轉義（對於數據庫API ..） cursor.execute('SELECT * from table where col1 = %s', tuple(["John's unescaped string"])) 產生一個錯誤。即使 cursor.execu

1熱度

1回答

在蜂巢

選擇下一個非空字段我有6場，看起來像這樣的表： Field1 Field2 Field3 Field4 Field5 Field6 ABC 45 XYZ JKL BNM 65 QWE JKL WER YUI IOP GHJ 我想從該表中提取數據到以上5個領域，我們忽略了一個新的表空值。我最後的表應該是這樣的： Result1 Result2 Result3 Re

0熱度

1回答

Impala掃描MapR-FS慢

我最近在三節點MapR羣集上安裝了Impala。當我運行一個簡單的查詢時，性能不如Impala + HDFS。以下是查詢： SELECT * FROM ft_test, ft_wafer WHERE ft_test_parquet.id = ft_wafer_parquet.id and month = 1 and day = 8 and param = 2913; 花了大約3秒。但

0熱度

1回答

UTC在因帕拉

在因帕拉pst轉換一些我得到不正確的數據，同時從UTC轉換爲PST.When時間戳我在蜂巢上運行相同的查詢，我得到正確的數據，但在黑斑羚PST轉換是沒有做正確的一些日期。帕拉： select from_utc_timestamp('2006-08-30 08:00:00','PST') 2006-08-30 01:00:00 蜂巢： select from_utc_timestamp('2

1熱度

1回答

Neo4j的APOC程序帕拉配置

1）從執行的 https://www.cloudera.com/downloads/connectors/impala/jdbc/2-5-37.html 2）下載的驅動程序帕拉37年2月5日： call apoc.load.driver("com.cloudera.impala.jdbc4.Driver") 任何錯誤。 3）執行的： CALL apoc.load.jdbc("jdbc:impa

-1熱度

1回答

Spark SQL vs Impala對於ETL

目前，我們正在使用傳統數據倉庫ETL工具IBM DataStage。我們希望遷移這些工作。這些工作主要包括連接和轉換來派生事實表。哪種技術可以更好地遷移這些工作？我們在使用ETL的Impala查詢時使用hue oozie，我們是否應該將spark sql用於ETL而不是Impala查詢？

0熱度

1回答

如何連接到pyspark的黑斑羚？

我想在PySpark中構建一個模型。並輸入此模型形成impala.PySpark可以連接嗎？謝謝！

0熱度

1回答

不一致的Hive左連接結果

我組成了一個簡單的左連接hiveql select * from a left outer join b on (a.f1=b.f1 and a.f2=b.f2) 以上查詢結果總數爲798,608。但是，表a中的記錄總數是780,499，它不匹配。我試圖找到只存在於左連接結果但不在表a中的所有記錄;結果返回空白。我甚至試圖用少量記錄創建2個小表（a'和b'），左連接結果的計數與表a'記錄的計