impala

    0熱度

    1回答

    使用Impala JDBC驅動程序,是否可以將查詢結果寫入CSV文件? OR是否是impala-shell才能實現這一目標的唯一方法? 從Web應用程序調用impala-shell的安全/性能副作用是什麼? 謝謝。

    3熱度

    3回答

    我試圖拆分由hive INSERT OVERWRITE TABLE ...在dfs.block.size邊界創建的parquet/snappy文件,因爲impala在分區中的文件大於塊大小時發出警告。 黑斑羚記錄以下警告: Parquet files should not be split into multiple hdfs-blocks. file=hdfs://<SERVER>/<PATH>

    0熱度

    1回答

    我注意到在一個應用程序中,併發讀取(使元數據無效)和OVERWRITING表導致底層文件損壞。 這是一個已知的場景嗎?我期望當表被覆蓋時,併發讀取將失敗,它不會破壞表的底層文件。 幫助將不勝感激!

    1熱度

    1回答

    我有一些使用存儲在S3中的SparkSQL創建的Parquet表格。我也想從Impala中使用它們。我還有一個在CDH5上運行的Impala實例,可以使用Hue訪問它。 我需要做什麼才能從此Impala實例查詢上述數據? Impala Parquet文檔似乎主要是關於將數據導入Parquet。我已經有Parquet中的數據,我只想指出Impala。我是Impala和Hue的新手,我的Parquet

    2熱度

    2回答

    蜂巢日期格式在impala中不支持。 我創建的分區上在蜂房表日期列,但是當我可以從hive_metadata在帕拉訪問相同的表其表示 引起的:TableLoadingException:無法加載表 'employee_part的元數據由於 分區列'hiredate'中不支持的分區列類型'DATE'。 請讓我知道hive和impala通常支持哪種日期格式。 我使用的日期格式在蜂巢作爲yyyy-mm-

    1熱度

    2回答

    我已閱讀進入一個HDFS路徑「XXX」,當我執行像 一些語句「LOAD DATA INPATH‘XXX’到表YYY ......」 的錯誤發生: ERROR: AuthorizationException: User 'ZZZ' does not have privileges to access: 'XXX' 爲什麼「LOAD DATA」語句需要比「READ」更多的特權?

    1熱度

    1回答

    使用Cloudera的Impala SQL,是否有辦法在白天截斷時間戳? 即去從: 2015-05-01 01:23:45 -> 2015-05-01 00:00:00 2015-05-01 12:34:56 -> 2015-05-01 00:00:00 2015-05-01 23:45:59 -> 2015-05-01 00:00:00 默認TRUNC選項似乎只是讓周或小時,沒有一天..

    3熱度

    1回答

    我創建了EMR羣集,但忘記添加一些我想玩的應用程序。這是一個「長時間運行」的集羣,所以我不能只創建一個新集羣。 我如何添加Ganglia,Impala和Hunk到正在運行的集羣? 此外,還有什麼需要做的HBase報告指標Ganglia?

    1熱度

    2回答

    我有包含大量記錄(39885593)的imapla表,並且需要通過Tableau使用impala表創建儀表板。 我試圖acheive以多種方式這一要求,如下 1)提取的帕拉從表中的數據在的Tableau提取物,然後創建所述儀表板。 2)最初使用數據提取,然後將連接切換到實時連接 3)實時連接 方法1:可以使用數據提取創建儀表板。給出好的表現。這個應用程序的問題是數據是每天都在增長的事務數據,所以如

    3熱度

    1回答

    關於impala,我試圖計算包含「101」,「102」或「103」的不同樣本ID的數量。 這裏是我的數據的例子: | sample_id | ___________ | 101-345-5 | | 101-345-6 | | 101-345-6 | | 102-345-5 | | 103-345-5 | | 103-345-8 | | 103-345-8 | 我想獲得的計數的多