2
我有一個數據幀:斯卡拉 - 第一個四分位數,第三個四分,並IQR從火花SQLContext數據幀不蜂巢
data.show()
+--------+------+------------------+
| Count| mean| stdev|
+--------+------+------------------+
| 5| 6337| 1684.569470220803|
| 3| 7224| 567.8250904401182|
| 330| 20280|23954.260831863092|
| 42| 26586| 32957.9072313323|
...
| 49| 23422|21244.094701798418|
| 4| 36949| 8616.596311769514|
| 35| 20915|14971.559603562522|
| 33| 20874|16657.756963894684|
| 14| 22698|15416.614921307082|
| 25| 19100| 12342.11627585264|
| 27| 21879|21363.736895687238|
+--------+------+------------------+
不使用蜂巢,我想第一個四分位數,第二個四分位數和IQR(四分位範圍)列「平均」。
其他解決方案似乎使用每個人都無法訪問的Hive。