我有一個RDD[String]
其中包含以下數據:Scala的RDD [字符串]到RDD [字符串,字符串]
數據格式:('Movie Name','Actress Name')
('Night of the Demons (2009) (uncredited)', '"Steff", Stefanie Oxmann Mcgaha')
('The Bad Lieutenant: Port of Call - New Orleans (2009) (uncredited)', '"Steff", Stefanie Oxmann Mcgaha')
('"Please Like Me" (2013) {All You Can Eat (#1.4)}', '$haniqua')
('"Please Like Me" (2013) {French Toast (#1.2)}', '$haniqua')
('"Please Like Me" (2013) {Horrible Sandwiches (#1.6)}', '$haniqua')
欲將此轉換爲RDD[String,String]
如第一元件' '
將是我在RDD中的第一個字符串,' '
中的第二個元素將成爲我在RDD中的第二個字符串。
我嘗試這樣做:
val rdd1 = sc.textFile("/home/user1/Documents/TestingScala/actress"
val splitRdd = rdd1.map(line => line.split(","))
splitRdd.foreach(println)
,但它給我一個錯誤:
[Ljava.lang.String;@7741fb9
[Ljava.lang.String;@225f63a5
[Ljava.lang.String;@63640bc4
[Ljava.lang.String;@1354c1de
這不是一個錯誤消息,這是一堆字符串的object-id。 – Malvolio
@Malvolio你能告訴我如何刪除該錯誤 – user225508
從'split'的結果調用'toList'。 – Reactormonk