2016-12-30 97 views
0

我有一個DataFrame與n場,其中一個包含逗號分隔值作爲String等,而另一個具有一個整數值 -分裂逗號分隔的字符串的列分成多個列PySpark與consatant除法因子爲其它行

field1 field2 field3 field4 .... fieldn 
ID0101 AB,CDE 0.9 objA  ----- 
ID1010 A,C,DE 0.7 objB  ----- 

現在我必須將其轉換成PySpark使用DataFrame以下

field1 field2 field3 field4 .... fieldn 
ID0101 AB  0.45 objA  ----- 
ID0101 CDE 0.45 objA  ----- 
ID1010 A  0.7 objB  ----- 
ID1010 C  0.7 objB  ----- 
ID1010 DE  0.7 objB  ----- 

。爲Scala找到了FlatMap版本,但在Python中無法這樣做。此外,由於我必須根據field4的值拆分field3的值,所以簡單的explodeflatmap將不起作用。

回答

-1

使用爆炸。例如:

from pyspark.sql.functions import explode 

df = inputDF.withColumn("field2", explode("field2")) 
相關問題