6
我正嘗試使用Apache Spark從管道(「|」)分隔文件生成格式化的CSV文件。輸入文件包含:Apache Spark RDD拆分「|」
蘋果|球|貓
布萊克頓|貝拉vista |格里納克
X | Y | Z
我與努力:
val name= sc.textFile(input.txt")
val split=name.map(line=>line.split("|")).map(x => (x(0),x(2)))
split.foreach(println)
輸出:
(X,Y)
(A,P)
(B,A)
我所需的輸出是:
(蘋果,貓)
(黑鎮,格里納克)
(X,Z)