當我嘗試在創建表中使用它時,我擁有的數據由'¬'分隔,因此我將錯誤視爲無效字符。我試圖使用它的unicode版本'\ U00AC',但沒有使用所有記錄在第一個字段中攝取。在unix中,這個字符'¬'顯示爲''。 任何人都可以指導我關於在該部分終止的字段中使用什麼。蜂巢表字段由'¬'分隔蜂巢不接受此字符
CREATE TABLE IF NOT EXISTS test
(
CONTACT_RECORD_ID string,
ACCOUNT string,
CUST string,
NUMBER string,
NUMBER1 string,
NUMBER2 string,
NUMBER3 string,
NUMBER4 string,
NUMBER5 string,
NUMBER6 string,
NUMBER7 string,
LIST string
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '¬';
在任何顯示器中,您都需要更改文本編碼設置。 –
在Linux上,'file xyz.txt'命令顯示什麼?即哪個編碼? Hadoop默認使用UTF-8。 –
是對其編碼爲ISO-8859文本的任何解決方案的朋友:) –