1
是否可以從Spark 2.0中的Dataframe列創建數據集? 我有以下問題:我想從日期分割的實木複合地板數據讀取一些數據,然後將其中一列轉換爲數據集。 〔實施例:如何從Spark 2.0中的DataFrame列創建數據集?
val frame = spark.read.parquet(path).select($"date", $"object".as[MyObjectType]).filter($"date" > "2016-10-01")
現在,我需要改造第二列Dataset[MyObjectType]
和不明白我怎麼能做到這一點。 MyObjectType是斯卡拉產品類型