2017-04-08 75 views
1

有關示例數據幀scholor阿帕奇火花AGG()函數

scala> scholor.show 

| id| name|age|sal|base| 

對於上面,下面都,給出相同的輸出。那麼將使用什麼agg()呢。它只是爲了名稱。

scala> scholor.groupBy("age").sum("base").show  /*with out agg */ 

scala> scholor.groupBy("age").agg(sum("base")).show  /* with agg */ 
+---+---------+ 
|age|sum(base)| 
+---+---------+ 

是否agg()需要任何可變參數作爲參數? 需要什麼agg()

在此先感謝。

+0

你需要加入什麼?結果是按年齡分組的基數之和。這已經是一個聚合。 –

+0

@JoostdenBoer:是的。總和,最小值,最大值,平均值等......已經是聚合函數。那麼爲什麼dataframe api提供了agg()方法。我認爲,這意味着什麼....搜索的東西! – Raghav

回答

1

爲了寫.sum該方法具有存在。它在API上被硬編碼。使用.agg您可以提供其他聚合功能,sum("column")只是其中之一。