我使用的Spark 1.5.1使用Scala 2.10.5星火1.5.1,斯卡拉2.10.5:如何擴大的RDD [數組[字符串],矢量]
我有一個RDD[Array[String], Vector]
每個在RDD的元素:
- 我想借此在
Array[String]
每個String
,並與Vector
結合起來 創建元組(String, Vector)
,這一步會導致創建幾個元組從的每個元素初始RDD
我們的目標是通過建立元組的RDD來結束:RDD[(String, Vector)]
,這RDD包含在上一步中創建的所有元組。
謝謝