impala

    0熱度

    1回答

    編輯: 表中有一些損壞的AVRO文件。刪除其中的一些後,每件事情都很好。我使用avro-tools將這些文件解壓縮爲json,解壓縮後的文件也不是很大。所以它似乎是Impala中處理損壞的AVRO文件的一些錯誤。 我有一個Impala表與Gziped AVRO格式,它是由「日」分區。當我執行查詢: select count(0) from adhoc_data_fast.log where day

    0熱度

    1回答

    我正在使用Hive連接hadoop。我們每天都有數據庫文件。我們的報告要求是在上個季度挑選最後一個文件。 例如如果我今天(4月11日)正在運行報告,則報告應顯示3月份加載的最後一個文件的數據。總之,我們推導出上個季度的Max(日期)。 我們使用日期格式爲YYYYMMDD(字符串數據類型)的Daily_Rec表及其對應的時間戳列YYYYMMDDHHMMSS。任何想法如何推導? pt_version

    0熱度

    1回答

    我試圖創建不是這樣的zip表格。 CREATE TABLE example_table (| a BIGINT, b BIGINT, v STRING, d TINYINT ) STORED AS TEXTFILE LOCATION /path/to/directory/ 這不是拉鍊表。我還想創建帶有zip的新表以獲取此錶的歷史記錄。我怎樣才能創建一個zip表?

    2熱度

    1回答

    組的第一行我有一個表格式如下: FieldA FieldB FieldC 1111 ABC X 1111 DEF Y 1111 GHI X 2222 JKL Y 2222 MNO X 3333 PQR U 3333 STT U 我要選擇每FIELDA一個FieldB有偏好的X在FieldC(如果沒有X,選擇另外一個)。 我已經嘗試使用RANK函數與PA

    0熱度

    1回答

    只是我們面臨的一個設計問題。 我有鑲木格式的蜂巢外部表列如下: describe payments_user col_name,data_type,comment ('amount_hold', 'int', '') ('id', 'int', '') ('transaction_id', 'string', '') ('recipient_id', 'string', '') ('y

    1熱度

    2回答

    我試圖從Oracle加載數據到Hive作爲實木複合地板。每次我加載一個包含日期/時間戳列的表格來配置單元時,它都會自動將這些列轉換爲BIGINT。是可以加載時間戳/日期格式配置單元使用sqoop和作爲parquet文件? 已經嘗試在配置單元中首先創建表,然後使用impala來LOAD DATA INPATH實木複合地板文件。 還是失敗,錯誤 「文件XX沒有列XX列不兼容的架構實木複合地板: TIM

    0熱度

    1回答

    我在蜂巢中有一個外部表,按年,月,日分區。所以我放棄了一個分區,但我仍然在顯示分區中看到它。 >use test_raw_tables; >show partitions test1_raw; [year=2016/month=01/day=01] [year=2017/month=03/day=24] > alter table test1_raw drop partition (ye

    1熱度

    1回答

    我想合併具有重疊日期間隔的表在Impala SQL中的行。然而,我發現解決此問題的解決方案並不受Impala支持。在哪裏存在和遞歸CTE。 我該如何在Impala中編寫查詢?什麼,我想實現的是 Table: @T ID StartDate EndDate 1 20170101 20170201 2 20170101 20170401 3 20170505 2

    1熱度

    1回答

    當我期運用這個命令得到了一個錯誤: $ beeline --silent=true -u 'jdbc:hive2://[ip]:21050/[database];auth=noSasl' -n 'username' -p 'password' -e 'use [database]; create table test_table (id int, name string);' Error: A

    1熱度

    1回答

    我有點困惑Apache Impala和Cloudera Impala。 他們之間有什麼大的區別嗎? 感謝, 楊憲益葉