我有一個表格,其中包含以下列。Hive根據時間戳選擇最新值的數據
C1,C2,Process TimeStamp,InsertDateTimeStamp
p1,v1,2014-01-30 12:15:23,2013-10-01 05:34:23
p1,v2,2014-01-31 05:11:34,2013-12-01 06:12:31
p1,v3,2014-01-31 07:16:05,2012-09-01 07:45:20
p2,v4,2014-02-01 09:22:52,2013-12-01 06:12:31
p2,v5,2014-02-01 09:22:52,2012-09-01 07:45:20
現在,我想根據最新Process TimeStamp
獲取每個主鍵的唯一行。
如果Process TimeStamp
是相同的,則應該選擇具有最新的InsertDateTimeStamp
的行。
所以,我的結果應該是。
p1,v3,2014-01-31 07:16:05,2012-09-01 07:45:20
p2,v4,2014-02-01 09:22:52,2013-12-01 06:12:31
如何通過HiveQL實現此目的?
我目前使用配置單元0.10。我不能在IN或EXISTS中使用子查詢。
謝謝。
謝謝。它的工作:) – jigarshah