0
從Avro文件創建地板文件。現在我需要在Pig中加載Parquet文件。以下是我從parquet-tools schema
命令獲得的架構。在Pig中加載嵌套Parquet文件?
message Logs {
optional group SUPER1 {
optional group FIELD1 (LIST) {
repeated int32 array;
}
optional group FIELD2 (LIST) {
repeated int32 array;
}
}
optional group SUPER2 {
optional int32 FIELD1;
optional binary FIELD2 (UTF8);
optional double FIELD3;
optional int32 FIELD4;
optional double FIELD5;
optional binary FIELD6 (UTF8);
}
optional group SUPER3 {
required int32 FIELD1;
required int32 FIELD2;
optional binary FIELD3 (UTF8);
optional binary FIELD4 (UTF8);
}
required binary SUPER4 (UTF8);
optional binary SUPER5 (UTF8);
}
現在我無法理解加載此文件的等效pig模式。我正在使用parquet.pig.ParquetLoader
。我做了以下轉變: -
- 陣列將被加載
chararray
- 如何加載嵌套數據? bid_info.creative_id不工作:
mismatched input '.' expecting RIGHT_PAREN
- 我正在加載所有字段,無論是否可選。 Pig中的可選值應該加載爲null。
我用簡單的加載,沒有任何明確的方案也試圖然後我得到這個錯誤:
Failed to parse: Invalid list type optional group FIELD1 (LIST) {
repeated int32 array;
}