從具有管分隔符的巨大文件創建包含大量列(字符串)(> 100)的Hive表的最佳方式是什麼?Hive創建包含大量列的表
- 如果我在create table命令中提到超過100個列名,會出現問題嗎?
如果我決定不想命名每個列,我可以a)根本不提及列名稱,並讓Hive按照其默認命名命名列名稱。我該怎麼做b)提及只有一些列表示第一個10.在這種情況下剩餘列會發生什麼? 我試着這樣說:
CREATE EXTERNAL TABLE IF NOT EXISTS table1 ROW FORMAT DELIMITED FIELDS TERMINATED BY '|' LOCATION 'folder1/folder2/folder3/filename';
我得到一個錯誤說「列列出或應指定自定義序列」。我需要一個自定義序列化程序嗎? 如果外部表沒有分區,我該如何添加分區?
你可以在apache drill或impala中做到這一點 – nir
如果你創建一個只有一個字符串列的導入表,並以這種方式引用文件,它可能會工作。然後,您可以使用'create table as'語句來執行一個查詢,該查詢使用可能的split來從字符串中生成數組,然後使用explode語句將其轉換爲表格。雖然從這裏拍攝臀部...... – LiMuBei