假設我有數據集,如:如何將行拆分爲Spark DataFrame/DataSet中的不同列?
Name | Subject | Y1 | Y2
A | math | 1998| 2000
B | | 1996| 1999
| science | 2004| 2005
我想拆分此數據集這樣的行時,Y2列將被淘汰,如:
Name | Subject | Y1
A | math | 1998
A | math | 1999
A | math | 2000
B | | 1996
B | | 1997
B | | 1998
B | | 1999
| science | 2004
| science | 2005
有人建議可以在這裏的東西?我希望我已經清楚了我的問題。提前致謝。
@cheseaux你爲什麼要刪除你的答案?這對我來說似乎是有效的。 – eliasah