我有一個CSV與一個單塔文件和行被定義如下:轉換管分隔的文件火花數據幀到CSV文件
123 || food || fruit
123 || food || fruit || orange
123 || food || fruit || apple
我想創建與單個列csv文件和不同的行值:
orange
apple
我用下面的代碼嘗試:
val data = sc.textFile("fruits.csv")
val rows = data.map(_.split("||"))
val rddnew = rows.flatMap(arr => {
val text = arr(0)
val words = text.split("||")
words.map(word => (word, text))
})
但這段代碼並沒有給我想要的正確結果。
任何人都可以請幫助我嗎?
是的謝謝你,它的工作。 – user2122466
如何添加|^|火花csv輸出分隔符? – SUDARSHAN