impala

0熱度

1回答

編輯：表中有一些損壞的AVRO文件。刪除其中的一些後，每件事情都很好。我使用avro-tools將這些文件解壓縮爲json，解壓縮後的文件也不是很大。所以它似乎是Impala中處理損壞的AVRO文件的一些錯誤。我有一個Impala表與Gziped AVRO格式，它是由「日」分區。當我執行查詢： select count(0) from adhoc_data_fast.log where day

0熱度

1回答

蜂巢 - 如何從上一季度挑選最大（日期）

我正在使用Hive連接hadoop。我們每天都有數據庫文件。我們的報告要求是在上個季度挑選最後一個文件。例如如果我今天（4月11日）正在運行報告，則報告應顯示3月份加載的最後一個文件的數據。總之，我們推導出上個季度的Max（日期）。我們使用日期格式爲YYYYMMDD（字符串數據類型）的Daily_Rec表及其對應的時間戳列YYYYMMDDHHMMSS。任何想法如何推導？ pt_version

0熱度

1回答

在HDFS中創建zip表格

我試圖創建不是這樣的zip表格。 CREATE TABLE example_table (| a BIGINT, b BIGINT, v STRING, d TINYINT ) STORED AS TEXTFILE LOCATION /path/to/directory/ 這不是拉鍊表。我還想創建帶有zip的新表以獲取此錶的歷史記錄。我怎樣才能創建一個zip表？

2熱度

1回答

選擇與標準

組的第一行我有一個表格式如下： FieldA FieldB FieldC 1111 ABC X 1111 DEF Y 1111 GHI X 2222 JKL Y 2222 MNO X 3333 PQR U 3333 STT U 我要選擇每FIELDA一個FieldB有偏好的X在FieldC（如果沒有X，選擇另外一個）。我已經嘗試使用RANK函數與PA

0熱度

1回答

如何實現鑲木地板格局的變化

只是我們面臨的一個設計問題。我有鑲木格式的蜂巢外部表列如下： describe payments_user col_name,data_type,comment ('amount_hold', 'int', '') ('id', 'int', '') ('transaction_id', 'string', '') ('recipient_id', 'string', '') ('y

1熱度

2回答

HIVE表上的TIMESTAMP

我試圖從Oracle加載數據到Hive作爲實木複合地板。每次我加載一個包含日期/時間戳列的表格來配置單元時，它都會自動將這些列轉換爲BIGINT。是可以加載時間戳/日期格式配置單元使用sqoop和作爲parquet文件？已經嘗試在配置單元中首先創建表，然後使用impala來LOAD DATA INPATH實木複合地板文件。還是失敗，錯誤「文件XX沒有列XX列不兼容的架構實木複合地板： TIM

0熱度

1回答

分區仍然顯示在配置單元中，即使它們在外部表中丟失

我在蜂巢中有一個外部表，按年，月，日分區。所以我放棄了一個分區，但我仍然在顯示分區中看到它。 >use test_raw_tables; >show partitions test1_raw; [year=2016/month=01/day=01] [year=2017/month=03/day=24] > alter table test1_raw drop partition (ye

1熱度

1回答

Impala SQL：合併具有重疊日期的行。 WHERE EXISTS和遞歸CTE不支持

我想合併具有重疊日期間隔的表在Impala SQL中的行。然而，我發現解決此問題的解決方案並不受Impala支持。在哪裏存在和遞歸CTE。我該如何在Impala中編寫查詢？什麼，我想實現的是 Table: @T ID StartDate EndDate 1 20170101 20170201 2 20170101 20170401 3 20170505 2

1熱度

1回答

使用直線上運行遠程斑羚一些SQL失敗

當我期運用這個命令得到了一個錯誤： $ beeline --silent=true -u 'jdbc:hive2://[ip]:21050/[database];auth=noSasl' -n 'username' -p 'password' -e 'use [database]; create table test_table (id int, name string);' Error: A

1熱度

1回答

Apache Impala和Cloudera Impala有什麼區別？

我有點困惑Apache Impala和Cloudera Impala。他們之間有什麼大的區別嗎？感謝，楊憲益葉