我是新的斯卡拉和火花並試圖瞭解這裏幾個基本的東西。斯卡拉返回值計算在foreach
使用Spark版本1.5。
爲什麼sum的值在以下foreach循環中沒有得到更新。
var sum=1;
df.select("column1").distinct().foreach(row=>{
sum = sum +1
})
println("SUM = "sum)
- >SUM = 1
我想了解什麼變量的範圍稱爲中的for-each。如果我需要在內部進行一些數學運算並在for循環外獲得結果,該怎麼辦?
上面的理解我的用例是在循環中獲取唯一值並將其附加到String列表中。
你應該提到你不僅在標籤中使用Spark,因爲它很重要。這對於Scala系列非常適用。 –