0
我有一個公園配對rdd(鍵,陣列(值1,值2,值3 .....))。 我應該寫什麼scala語句? 我怎麼能持平RDD並創建一個新的RDD:(鍵,值1),(鍵,值2),(鍵,值3)....火花rdd如何扁平鍵 - 陣列(值)對
我有一個公園配對rdd(鍵,陣列(值1,值2,值3 .....))。 我應該寫什麼scala語句? 我怎麼能持平RDD並創建一個新的RDD:(鍵,值1),(鍵,值2),(鍵,值3)....火花rdd如何扁平鍵 - 陣列(值)對
rdd.flatMap{case (k,v) => v.map(vx => (k,vx))}
正如@moto說,那簡直就是
rdd.flatMapValues(v => v)
一個更詳細的但更易讀選項:
rdd.flatMap {
case (key, values) => values.map(v => key -> v)
}
可能只是'rdd.flatMapValues(X => X)' – mtoto