我有一個json文件,其中原始文本如下所示: {a:1,b:2,c:3} {a:3,b:3,c:5} {a:3,b:3, c:9}如何使用Pig讀取非分隔的JSON?
做raw = LOAD'jsonfile.text'使用JsonLoader('a:chararry,b:chararray,c:chararry');
dump raw;
只返回1條記錄。
從日誌實際摘錄:
輸入(S): 成功讀取1條記錄(630644858個字節)從「S3N://logstash/ls.s3.ip-10-45-56-56.2016- 03-02T23.10.part42.txt」
產出: 在已成功存儲1個記錄(1900個字節): 「HDFS:// nameservice1/TMP/TEMP-1489272670/TMP-1959659634」
看起來只有JSON的第一個記錄正在被讀取。 Json文件不分隔。
任何人有任何提示嗎?
爲格式不正確的json添加信封? –