impala

0熱度

1回答

使用Impala JDBC驅動程序，是否可以將查詢結果寫入CSV文件？ OR是否是impala-shell才能實現這一目標的唯一方法？從Web應用程序調用impala-shell的安全/性能副作用是什麼？謝謝。

3熱度

3回答

我試圖拆分由hive INSERT OVERWRITE TABLE ...在dfs.block.size邊界創建的parquet/snappy文件，因爲impala在分區中的文件大於塊大小時發出警告。黑斑羚記錄以下警告： Parquet files should not be split into multiple hdfs-blocks. file=hdfs://<SERVER>/<PATH>

0熱度

1回答

Impala並行讀取和覆蓋

我注意到在一個應用程序中，併發讀取（使元數據無效）和OVERWRITING表導致底層文件損壞。這是一個已知的場景嗎？我期望當表被覆蓋時，併發讀取將失敗，它不會破壞表的底層文件。幫助將不勝感激！

1熱度

1回答

Impala訪問S3中現有的Parquet表格

我有一些使用存儲在S3中的SparkSQL創建的Parquet表格。我也想從Impala中使用它們。我還有一個在CDH5上運行的Impala實例，可以使用Hue訪問它。我需要做什麼才能從此Impala實例查詢上述數據？ Impala Parquet文檔似乎主要是關於將數據導入Parquet。我已經有Parquet中的數據，我只想指出Impala。我是Impala和Hue的新手，我的Parquet

2熱度

2回答

蜂巢日期格式在impala中不支持

蜂巢日期格式在impala中不支持。我創建的分區上在蜂房表日期列，但是當我可以從hive_metadata在帕拉訪問相同的表其表示引起的：TableLoadingException：無法加載表 'employee_part的元數據由於分區列'hiredate'中不支持的分區列類型'DATE'。請讓我知道hive和impala通常支持哪種日期格式。我使用的日期格式在蜂巢作爲yyyy-mm-

1熱度

2回答

訪問被拒絕當「LOAD DATA」在蜂巢

我已閱讀進入一個HDFS路徑「XXX」，當我執行像一些語句「LOAD DATA INPATH‘XXX’到表YYY ......」的錯誤發生： ERROR: AuthorizationException: User 'ZZZ' does not have privileges to access: 'XXX' 爲什麼「LOAD DATA」語句需要比「READ」更多的特權？

1熱度

1回答

Impala SQL - 如何截斷時間戳爲天？

使用Cloudera的Impala SQL，是否有辦法在白天截斷時間戳？即去從： 2015-05-01 01:23:45 -> 2015-05-01 00:00:00 2015-05-01 12:34:56 -> 2015-05-01 00:00:00 2015-05-01 23:45:59 -> 2015-05-01 00:00:00 默認TRUNC選項似乎只是讓周或小時，沒有一天..

3熱度

1回答

將應用程序（Ganglia，Impala，Hunk）添加到運行EMR羣集

我創建了EMR羣集，但忘記添加一些我想玩的應用程序。這是一個「長時間運行」的集羣，所以我不能只創建一個新集羣。我如何添加Ganglia，Impala和Hunk到正在運行的集羣？此外，還有什麼需要做的HBase報告指標Ganglia？

1熱度

2回答

使用Impala作爲數據源創建Tableau儀表板

我有包含大量記錄（39885593）的imapla表，並且需要通過Tableau使用impala表創建儀表板。我試圖acheive以多種方式這一要求，如下 1）提取的帕拉從表中的數據在的Tableau提取物，然後創建所述儀表板。 2）最初使用數據提取，然後將連接切換到實時連接 3）實時連接方法1：可以使用數據提取創建儀表板。給出好的表現。這個應用程序的問題是數據是每天都在增長的事務數據，所以如

3熱度

1回答

Impala查詢：結合多個COUNT DISTINCT WHERE子句

關於impala，我試圖計算包含「101」，「102」或「103」的不同樣本ID的數量。這裏是我的數據的例子： | sample_id | ___________ | 101-345-5 | | 101-345-6 | | 101-345-6 | | 102-345-5 | | 103-345-5 | | 103-345-8 | | 103-345-8 | 我想獲得的計數的多