1
如何在spark-sql
中獲得每個組的頂級n(可以說排名前10位或前3位)?Spark sql top n per group
http://www.xaprb.com/blog/2006/12/07/how-to-select-the-firstleastmax-row-per-group-in-sql/提供了一般SQL的教程。但是,spark不會在where子句中實現子查詢。
如何在spark-sql
中獲得每個組的頂級n(可以說排名前10位或前3位)?Spark sql top n per group
http://www.xaprb.com/blog/2006/12/07/how-to-select-the-firstleastmax-row-per-group-in-sql/提供了一般SQL的教程。但是,spark不會在where子句中實現子查詢。
這個偉大的工程在斯卡拉。然而,由於SQL字符串失敗,如此處所述的一個奇怪的錯誤https://gist.github.com/geoHeil/3dff11860ae042792cea6970447c4592失敗:''聯盟''預期,但'('發現 –
解決方法是:http://stackoverflow.com /問題/ 31786912 /火花故障工會預期,但發現的 –