2
我有創建數據框架的代碼,如果在我的輸入數據中沒有數組,那麼這可以正常工作。如何使用spark在數據框架中創建模式陣列
我試過使用JSON數據,沒有數組,它運行成功。 我的代碼是
val vals = sc.parallelize(
"""{"id":"1","name":"alex"}""" ::
Nil
)
val schema = (new StructType)
.add("id", StringType)
.add("name", StringType)
sqlContext.read.schema(schema).json(vals).select($"*").printSchema()
我的問題是,如果我有輸入數據與數組像下面那麼如何創建模式?
val vals = sc.parallelize(
"""{"id":"1","name":"alex","score":[{"keyword":"read","point":10}]}""" ::
Nil
)
val schema = (new StructType)
.add("id", StringType)
.add("name", StringType)
謝謝。
有在網絡上這麼多的文章。你有什麼嘗試? – Samar