日期,時間範圍內丟失記錄我的形式如何創建的Pig Latin
2013-07-09T19:17Z,f1,f2
2013-07-09T03:17Z,f1,f2
2013-07-09T21:17Z,f1,f2
2013-07-09T16:17Z,f1,f2
2013-07-09T16:14Z,f1,f2
2013-07-09T16:16Z,f1,f2
2013-07-09T01:17Z,f1,f2
2013-07-09T16:18Z,f1,f2
的輸入記錄這些代表時間戳和事件。我手寫這些,但實際數據應該根據時間進行排序。
我想生成一組記錄,這些記錄將被輸入到需要連續時間序列的圖形繪圖功能中。我想填寫缺失值,即如果有「2013-07-09T19:17Z」和「2013-07-09T19:19Z」的條目,我想爲「2013-07-09T19:18Z」生成條目「與預定義值。
我就這樣做的想法:
- 使用MIN和MAX找到該系列中的開始和結束日期
- 寫UDF這需要最小值和最大值,並返回一個缺少 關係時間戳
- 加入以上2個關係
我不能讓我的頭在如何實施這個在PIG雖然。將不勝感激任何幫助。
謝謝!