3
您好,其實問題如下,我想插入蜂巢表中的數據有拉丁文字和它的utf-8編碼格式。但仍然配置單元不能正確顯示它。Hive Utf-8編碼支持的字符數量?
數據在蜂房
插入我改變表的編碼爲UTF-8,以及仍然相同的問題下面是蜂巢DDL和命令
CREATE TABLE IF NOT EXISTS test6
(
CONTACT_RECORD_ID string,
ACCOUNT string,
CUST string,
NUMBER string,
NUMBER1 string,
NUMBER2 string,
NUMBER3 string,
NUMBER4 string,
NUMBER5 string,
NUMBER6 string,
NUMBER7 string,
LIST string
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '|';
ALTER TABLE test6 SET serdeproperties ('serialization.encoding'='UTF-8');
配置單元是否只支持UTF-8的前128個字符? 請確認。
_「配置單元無法正確顯示它」_ - 您確定它不是*顯示器嗎?你是否強制執行'export LANG = en_US.UTF-8',並檢查你的終端應用是否期望UTF-8(例如PuTTY,_Window> Translation> Remote charset = UTF-8_)? –
另外,您是否下載了一個HDFS文件並在其上運行'file'命令,以確保它實際檢測到UTF-8內容? –