Milyonlarca satır (5 TB + tablo) için iç içe JSON'dan bazı değerler almaya çalışıyorum. Bunu yapmanın en etkili yolu nedir?Hive: ayrıştırma JSON
{"country":"US","page":227,"data":{"ad":{"impressions":{"s":10,"o":10}}}}
Yukarıda JSON dışında bu değerleri gerekir::
Country Page impressions_s impressions_o
--------- ----- ------------- --------------
US 2 10 10
Bu Hive en json_tuple fonksiyonudur, bu iyi fonksiyon olup olmadığından emin değilim Burada
bir örnektir. https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-getjsonobject