我試圖加載CSV文件轉換成蜂巢表所示:用逗號蜂巢負載CSV在引述領域
CREATE TABLE mytable
(
num1 INT,
text1 STRING,
num2 INT,
text2 STRING
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ",";
LOAD DATA LOCAL INPATH '/data.csv'
OVERWRITE INTO TABLE mytable;
CSV文件是由逗號分隔(,),看起來像這樣:
1, "some text, with comma in it", 123, "more text"
由於第一個字符串中存在',',這將返回損壞的數據。
有沒有辦法設置文本分隔符或使Hive忽略字符串中的','?
我無法更改csv的分隔符,因爲它被從外部源拉取。
謝謝你做到了! –
sed -i's /「// g'your_file_name通過刪除引用的文本進行預處理。但是,您需要確保不會無意中刪除其他打算引用的(」)字符。 – ekta