我有一個斯卡拉陣列「visitedArray」與值如下:斯卡拉陣列爲String,地圖[字符串,任何]
Array(
(Map(url -> http://www.tumblr.com/tagged/abc), Map(visited -> true)),
(Map(url -> http://www.tumblr.com/tagged/random-blog), Map(visited -> true)),
(Map(url -> http://www.livestream.com/forum/1),Map(visited -> false))
....
但是,我想將其轉換爲字符串,地圖[字符串,任何]和想要的結果出現,如:
(
(http://www.tumblr.com/tagged/kate-beckett, Map(visited -> true),
(http://www.tumblr.com/tagged/random-blog), Map(visited -> true)
....
我已經試過:
val testRdd = sc.parallelize(visitedArray)
val formatedRdd = testRdd.map(t => (t._1("url"), t._2))
但是,它不會重新變成所需的格式。它返回:
Array(
(http://www.tumblr.com/tagged/kate-beckett, Map(visited -> true),
(http://www.tumblr.com/tagged/random-blog), Map(visited -> true)
....
我怎樣才能達到我想要的(轉換爲字符串,地圖[字符串,任何]沒有陣列()
你想一個數組或RDD? –
我想將數組轉換爲RDD。 - > Array to [String,Map [String,Any]] – user3776105
我不完全確定你爲什麼需要Spark在這裏。你是否從其他RDD獲得這些值? –