「NULL」我有一個包含一串與相關數據(用戶,位置等)的鳴叫上亞馬遜DynamoDB。我通過管道輸出了這個,並得到了一個json文件。 其導出爲CSV文件將是一個糟糕的主意,因爲許多鳴叫包含在文本字段中的逗號。隨着新的蜂巢,因爲我,我至少知道,加載JSON文件,我需要某種形式的SERDE。蜂巢:JSON SERDE文件返回外部表
這是我如何創建表:
create external table tablename (
id string,
created_at string,
followers_count string,
geo string,
location string,
polarity string,
screen_name string,
sentiment string,
subjectivity string,
tweet string,
username string)
ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe'
SAVE AS TEXTFILE ;
我沒有得到任何錯誤,但後來我做的:
load data inpath '/user/exam'
overwrite into table tablename;
(這是JSON文件的存儲位置)
當我做 「select * from tablename limit 5;
」 一切都來了NULL:
hive> select * from wcd.tablename limit 5;
OK
{ NULL NULL NULL NULL NULL NULL NULL NULL NULL NULL
{ NULL NULL NULL NULL NULL NULL NULL NULL NULL NULL
{ NULL NULL NULL NULL NULL NULL NULL NULL NULL NULL
{ NULL NULL NULL NULL NULL NULL NULL NULL NULL NULL
{ NULL NULL NULL NULL NULL NULL NULL NULL NULL NULL
如果有人想看看有問題的文件,它的網址爲:
http://www.vaughn-s.net/hadoop
任何援助將不勝感激!
你可以把一些示例你的數據? – hlagos
是的,有在這個職位底部的整個文件的鏈接;不過,如果您願意,我可以發佈snippits。 –