0
from pyspark.sql.functions import split, explode
sheshakespeareDF = sqlContext.read.text(fileName).select(removePunctuation(col('value')))
shakespeareDF.show(15, truncate=False)
數據框看起來是這樣的:字數: '列' 對象不是可調用
ss = split(shakespeareDF.sentence," ")
shakeWordsDFa =explode(ss)
shakeWordsDF_S=sqlContext.createDataFrame(shakeWordsDFa,'word')
任何想法,我究竟做錯了什麼?提示說Column is not iterable
。
我該怎麼辦?我只想將shakeWordsDFa
更改爲數據框並重命名。
這是CS110X HW來自edx – eliasah