我正在運行一個查詢,但我有點卡在HiveQL中的子查詢的概念。我是Hive的新手,我做了很多閱讀,但仍然無法實現。Hive SELECT DISTINCT和GROUP BY在子查詢中
所以我有一個很大的表,我有興趣在created_date
和size
。所以我基本上想要在不同的年份運行特定年份和組中創建的文件大小總和。
我當前的查詢:
SELECT year(created_date), SUM(size) FROM <tablename> GROUP BY created_date
2001 2654567
2001 231818
2001 1978222
2002 7625332
2002 6272829
2003 2733792
這給了我表中的所有這些年來,每年爲以上的款項清單,但我有一年的重複,這是我需要做的一個子查詢到SELECT DISTINCT
年,總和也爲size
。
任何幫助將是非常棒的。
爲什麼不選'年份(created_date),SUM(size)FROM GROUP BY year(created_date)'? –