創建從給定的開始和結束日期的順序排列我有ID的數據表,開始和結束爲列,如:在HIVE
ID |開始| end
1 | 2011-01-01 | 2011-01-03
2 | 2011-02-13 | 2011-02-14
什麼,我想在HIVE做的是天的全範圍添加爲一個單獨的列的數組,所以我想獲得:
ID |開始|結束|範圍
1 | 2011-01-01 | 2011-01-03 | ['2011-01-01','2011-01-02','2011-01-03']
2 | 2011-02-13 | 2011-02-14 | ['2011-02-13','2011-02-14']
我試圖使用collect_set(),但無法讓它工作。你有什麼建議嗎?謝謝!
在你的數據集天的範圍,或者你需要基於'start'和'端生成它們'? – gobrewers14
@ GoBrewers14我需要根據開始和結束首先生成它們,然後將它們插入到新列中。 – Ado