0
我有一個DataFrame
與n場,其中一個包含逗號分隔值作爲String
等,而另一個具有一個整數值 -分裂逗號分隔的字符串的列分成多個列PySpark與consatant除法因子爲其它行
field1 field2 field3 field4 .... fieldn
ID0101 AB,CDE 0.9 objA -----
ID1010 A,C,DE 0.7 objB -----
現在我必須將其轉換成PySpark
使用DataFrame
以下
field1 field2 field3 field4 .... fieldn
ID0101 AB 0.45 objA -----
ID0101 CDE 0.45 objA -----
ID1010 A 0.7 objB -----
ID1010 C 0.7 objB -----
ID1010 DE 0.7 objB -----
。爲Scala找到了FlatMap
版本,但在Python中無法這樣做。此外,由於我必須根據field4
的值拆分field3
的值,所以簡單的explode
或flatmap
將不起作用。