編輯: 表中有一些損壞的AVRO文件。刪除其中的一些後,每件事情都很好。我使用avro-tools將這些文件解壓縮爲json,解壓縮後的文件也不是很大。所以它似乎是Impala中處理損壞的AVRO文件的一些錯誤。 我有一個Impala表與Gziped AVRO格式,它是由「日」分區。當我執行查詢: select count(0) from adhoc_data_fast.log where day
我試圖創建不是這樣的zip表格。 CREATE TABLE example_table (| a BIGINT, b BIGINT, v STRING, d TINYINT ) STORED AS TEXTFILE LOCATION /path/to/directory/
這不是拉鍊表。我還想創建帶有zip的新表以獲取此錶的歷史記錄。我怎樣才能創建一個zip表?
組的第一行我有一個表格式如下: FieldA FieldB FieldC
1111 ABC X
1111 DEF Y
1111 GHI X
2222 JKL Y
2222 MNO X
3333 PQR U
3333 STT U
我要選擇每FIELDA一個FieldB有偏好的X在FieldC(如果沒有X,選擇另外一個)。 我已經嘗試使用RANK函數與PA
我試圖從Oracle加載數據到Hive作爲實木複合地板。每次我加載一個包含日期/時間戳列的表格來配置單元時,它都會自動將這些列轉換爲BIGINT。是可以加載時間戳/日期格式配置單元使用sqoop和作爲parquet文件? 已經嘗試在配置單元中首先創建表,然後使用impala來LOAD DATA INPATH實木複合地板文件。 還是失敗,錯誤 「文件XX沒有列XX列不兼容的架構實木複合地板: TIM