2
我正在將數據從csv文件導入Hive。我的表格包含字符串和整數。然而,在我輸入文件,該整數有他們周圍的空白,所以它看起來是這樣的:將數據導入包含空白的Hive
some string, 2 ,another string , 7 , yet another string
不幸的是我無法控制的程序提供文件的格式。
當我使用(例如)導入數據:
CREATE TABLE MYTABLE(string1 STRING, alpha INT, string2 STRING, beta INT, string3 STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
然後,所有我得到的整數設置爲NULL。我假設這是因爲額外的空白使解析失敗。有沒有解決的辦法?
謝謝 - 我會標記爲正確的,除非有人知道在一次傳遞中做到這一點。 –
如果您可以連接到源數據作爲外部表,您也可以一次處理。我會適當地編輯我的答案。 –
我仍然有這種方法的問題,因爲如果您將數據類型更改爲「double」,則空白被忽略... – grundprinzip