斯卡拉讀文件，分割，然後保存到VAL

hello.txt的

這裏是Scala代碼：

val textFile = sc.textFile("/home/winsome/share/hello.txt") 
val ratings = textFile.map { line => 
    val fields = line.split(" ") 
    val (id, linksStr) = (fields(0).toInt, fields(1).toInt) 
    println(id)  //1 2 5 6 
    printlin(linkStr) //2 2 12 4 
}

println(id)和printlin(linkStr)做沒有，請告訴我如何顯示我想要的格式
謝謝

來源

2015-04-22 user2492364

您可能想試試這個：讀取文件中的所有行按空格分隔行並將其映射到您的ID和lnkstrs中，然後將其打印出來。

val lines = io.Source.fromFile("hello.txt").getLines() 

    lines.map { x => 
     val value = x.split(" ") 
     (value.head.toInt, value.last.toInt) 
    }.foreach { z => 
     println(z._1) 
     println(z._2) 
    }

來源

2015-04-22 07:03:54 curious

OP的使用Spark，雖然 –

我在您的代碼中看到3個可能的問題。首先，你確定你只有空格作爲分隔符嗎？讓我們使用任意數字的非數字：line.split("[^\\d]+")。第二，第一行[, 1] - 它有不同的結構，所以你應該刪除這一行。第三個問題是您使用map進行副作用操作。 map必須是純功能的，只能用於數據轉換。用於打印到控制檯使用foreach。讓我們結束了：

val textFile = sc.textFile("/home/winsome/share/hello.txt") 
val ratings = textFile 
    .map (line => { 
    val fields = line.split("[^\\d]+") 
    (fields(0).toInt, fields(1).toInt) 
    }) 
    .foreach(println)

來源

2015-04-22 07:07:51 ipoteka

所以我應該刪除'''[，1]''''？我可以通過這條線 – user2492364

你可以過濾這條線textFile.filter（line =>！（line contains「[，1]」）。map（...） – ipoteka

假設每行是製表符分隔考慮這樣的分裂，

line.split("\t")

更簡單的，沒有分離的假設，分裂字母話，

line.split("\\W+")

也用於提取每個單詞考慮

val Array(a,b,_*) = line.split("\\W+")

來源

2015-04-22 07:28:03 elm

斯卡拉讀文件，分割，然後保存到VAL

回答

相關問題