1
我試圖在我的數據庫上運行MLlib算法之一,即LogisticRegressionWithLBFGS。Apache Spark MLlib LabeledPoint空標籤問題
該算法將訓練集作爲LabeledPoint。由於LabeledPoint需要雙重標籤(LabeledPoint(雙標籤,Vector特徵)),而且我的數據庫包含一些空值,我該如何解決這個問題?
在這裏你可以看到一段代碼與此相關的問題:
val labeled = table.map{ row =>
var s = row.toSeq.toArray
s = s.map(el => if (el != null) el.toString.toDouble)
LabeledPoint(row(0), Vectors.dense((s.take(0) ++ s.drop(1))))
}
和錯誤,我得到:
error : type mismatch;
found : Any
required: Double
不使用LabeledPoint我可以運行此算法或哪能克服這個「空值」問題?