我有很多gzip'd日誌文件在s3中有3種類型的日誌行:b,c,i。我和c都是單級json:如何解析Pig中的JSON?
{"this":"that","test":"4"}
b類型是深深嵌套的json。我碰到這個gist談論編譯一個罐子,使這項工作。由於我的Java技能不如恆星,我不知道從這裏做什麼。
{"this":{"foo":"bar","baz":{"test":"me"},"total":"5"}}
由於I型和C並不總是以相同的順序,這使得指定一切都在生成正則表達式困難。是否可以使用Pig處理JSON(在gzip文件中)?我使用任何版本的Pig都是基於Amazon Elastic Map Reduce實例構建的。
這可歸結爲兩個問題: 1)我可以用Pig解析JSON嗎?如果是,如何? 2)如果我可以解析JSON(從gzip'd日誌文件),我可以解析嵌套的JSON對象嗎?
鏈接上的「建立數據庫連接時出錯」 – andreban 2013-08-07 23:27:16