2016-03-09 70 views
1

我使用Spark MLLib在LabeledPoints的RDD上進行SVM分類。 我想交叉驗證它。哪種做法最好? 有沒有人有一個示例代碼?我發現CrossValidator類依賴於DataFrame。Spark MLLib SVM的交叉驗證

我的目標是獲得F分數。

回答

0

你可以找到一個完整的例子on Spark's github,但不支持SVM,但邏輯迴歸。

最好的方法是使用rdd.toDF()方法將RDD更改爲DataFrame。

+3

感謝迄今。在這個例子中,一個LogisticRegression對象被實例化並插入到管道中。它找不到任何SVM來實例化哪些適合流水線。使用哪個類? –