我想從嵌套的JSON中獲取一些數值爲數百萬行(5 TB +表)。什麼是最有效的方法來做到這一點?蜂巢:解析JSON
下面是一個例子:
{"country":"US","page":227,"data":{"ad":{"impressions":{"s":10,"o":10}}}}
我需要這些值超出上述JSON的:
Country Page impressions_s impressions_o
--------- ----- ------------- --------------
US 2 10 10
這是蜂巢的json_tuple功能,我不知道這是否是最好的功能。 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-getjsonobject