我的目標是讓每個數據點的k個最近鄰居。我想避免在查找時使用for循環,並在每個rdd_distance點上同時使用其他的東西,但我無法弄清楚如何執行此操作。 parsedData = RDD[Object]
//Object have an id and a vector as attribute
//sqdist1 output is a Double
var rdd_distance
我寫了一個算法來獲得一箇中綴語句將其更改爲postfix,現在我想對該語句執行計算。我看過this as a sample,但我無法理解它的某些部分會發生什麼。它正在使用Scala Stack。 如何做這部分工作: case x :: y :: xs => xs ++ List(op(y, x))
,我用我的計算類型是整數和RDDS因此,在這個例子中,如果我用「任何」取代「浮動」是對的嗎?
我正在閱讀Spark書籍中的一個Scala示例。這對我來說看起來很奇怪,至少作爲一個新手。我知道Scala中的標準匹配/案例結構如何在Scala中看起來像。但在這個例子中,我看到'case'正被使用,沒有相應的'match'關鍵字。它甚至有效嗎?或者書中有更多的錯字? val joined = userData.join(events)// RDD of (UserID, (UserInfo, L