2013-11-01 88 views
0

我正在運行一個查詢,但我有點卡在HiveQL中的子查詢的概念。我是Hive的新手,我做了很多閱讀,但仍然無法實現。Hive SELECT DISTINCT和GROUP BY在子查詢中

所以我有一個很大的表,我有興趣在created_datesize。所以我基本上想要在不同的年份運行特定年份和組中創建的文件大小總和。

我當前的查詢:

SELECT year(created_date), SUM(size) FROM <tablename> GROUP BY created_date 

2001 2654567 
2001 231818 
2001 1978222 
2002 7625332 
2002 6272829 
2003 2733792 

這給了我表中的所有這些年來,每年爲以上的款項清單,但我有一年的重複,這是我需要做的一個子查詢到SELECT DISTINCT年,總和也爲size

任何幫助將是非常棒的。

+0

爲什麼不選'年份(created_date),SUM(size)FROM GROUP BY year(created_date)'? –

回答

0

您可能想嘗試GROUPING BY年(因爲這是你正在選擇的)。

SELECT year(created_date), SUM(size) FROM <tablename> GROUP BY year(created_date) 
+0

拯救生命!非常感謝你。我一直在這裏主演一天,但我無法發現這一點。再次感謝Joy – kwasbob

+0

是的,它發生在我們所有人身上,很高興我可以幫忙:) – Chayemor