2017-01-26 70 views
4

我面臨的問題是,我有多個不同字符集的文件,比如說一個文件有中文字符集,另一個文件是法文字符集,我如何將它們加載到單個配置表中?我在網上搜索,發現: -將數據加載到具有多個字符集的配置單元表中

ALTER TABLE mytable SET SERDEPROPERTIES('serialization.encoding'='SJIS');

有了這個我可以處理中文或法文文件之一的字符集。有沒有辦法處理兩個字符集一次?

[UPDATE]

被使用好我使用RegexSerde對於固定寬度的文件一起編碼方案

是 - ISO 8859-1。看起來正則表達式Serde沒有考慮到這種編碼方案,並考慮默認的UTF-8編碼方案來分割字符。有沒有一種方法可以將Regex serde中的編碼方案考慮在內。

回答

相關問題