添加矢量我有兩個RDDS具有這種結構存在於兩個不同的RDDS階火花
org.apache.spark.rdd.RDD[(Long, org.apache.spark.mllib.linalg.Vector)]
這裏RDD的每一行包含一個索引Long
和向量org.apache.spark.mllib.linalg.Vector
。 我想將Vector
的每個組件添加到存在於其他RDD行中的其他Vector
的對應組件中。第一個RDD的每個矢量應該被添加到其他RDD的每個矢量。
一個例子是這樣的:
RDD1集:
Array[(Long, org.apache.spark.mllib.linalg.Vector)] =
Array((0,[0.1,0.2]),(1,[0.3,0.4]))
RDD2:
Array[(Long, org.apache.spark.mllib.linalg.Vector)] =
Array((0,[0.3,0.8]),(1,[0.2,0.7]))
結果:
Array[(Long, org.apache.spark.mllib.linalg.Vector)] =
Array((0,[0.4,1.0]),(0,[0.3,0.9]),(1,[0.6,1.2]),(1,[0.5,1.1]))
結果不正確,我想將第一個RDD中的每個向量添加到其他RDD的每個向量中,如示例中所述。 –
讓我看看你的進步..我們不是在這裏代表你寫代碼..顯示你的進度加上你的問題你卡在哪裏然後我們會幫你 –
非常感謝你,我已經解決了這個問題。 –