我使用Pentaho數據集成(Kettle)進行ETL過程,從MongoDB源中提取。Avro輸入釜中的日期字段模式
我的信號源有ISODateField所以JSON從提取返回是這樣的:
{ "_id" : { "$oid" : "533a0180e4b026f66594a13b"} , "fac_fecha" : { "$date" : "2014-04-01T00:00:00.760Z"} , "fac_fedlogin" : "KAYAK"}
所以,現在,我要反序列化JSON這與AVRO輸入。所以,我已經定義了AVRO模式 像
{
"type": "record",
"name": "xml_feeds",
"fields": [
{"name": "fac_fedlogin", "type": "string"},
{"name": "fac_empcod", "type": "string"},
{"name": "fac_fecha", "type": "string"}
]
}
這將是確定這fac_fecha可能是一個日期類型,但AVRO不支持這一點。
在執行時間內,AVRO Input會拒絕所有行,因爲它們有錯誤。這隻有在我使用日期字段時纔會發生。
我該怎麼做的任何建議?
水壺版本:4.4.0 Pentaho的,大數據的插件:1.3.0
是的,這是一個好主意。但是我通過升級Pentaho Big Data插件發現了一個非常簡單的解決方案 – Lucas