查找平均火花數據框的所有數值型變量的我有一個星火數據框與下面的結構出現在R: -R中
Var1----- Var 2----- Var 3 ------- Var 4----- Group
98.64---- 32.35---- 11906.91-- 08.65----- A
94.83---- 29.36---- 17287.57-- 06.01----- B
99.94---- 35.36---- 30411.85-- 08.82----- C
99.45---- 34.58---- 18267.26-- 10.09----- C
99.93---- 36.64---- 23560.04-- 07.34----- A
99.66---- 48.81---- 42076.44-- 08.44----- B
99.96---- 27.38---- 18474.01-- 11.39----- A
97.49---- 25.28---- 14615.50-- 06.60----- B
98.98---- 32.50---- 10282.90-- 07.71----- C
99.57---- 31.54---- 12725.56-- 06.17----- C
99.91---- 26.46---- 10990.13-- 06.17----- C
這是我代表的數據集,記錄數量是相當巨大的。同樣,列的數量也超過200。
有人可以幫助我以下結果集。對於R中的本地數據幀,使用DPLYR來執行此操作非常簡單。但在星火據幀的工作似乎
Group Average_Var1 Average_Var2 Average_Var3 Average_Var4
A ----- 99.51 ------------ 32.13 ---------- 17980.34 ----- 9.13
B ----- 97.32 ------------ 34.42 ---------- 24659.83 ----- 6.89
C ----- 99.57 ------------ 32.10 ---------- 16535.54 ----- 7.78
不能完全肯定,但你可以使用'sparklyr'包,你可以試試:%>% summarize_all(.funs =平均)' – TUSHAr
是否使用 'DF%>% GROUP_BY(集團) SparkR或Sparklyr? – nate
使用SparkR得到結果 –