2014-10-10 29 views
2

使用org.apache.spark.mllib.util.MLUtils包中的以下方法,將LIBSVM格式的二進制標記數據加載到RDD [LabeledPoint]中,具有自動確定的功能數量和分區的默認數量。如何將具有多個類的LibSVM文件轉換爲RDD [labelPoint]

def loadLibSVMFile(sc: SparkContext, path: String): RDD[LabeledPoint] 

我的問題是用多類標籤加載數據? 在多類標籤數據上使用此方法時...將其轉換爲二進制標籤數據.. 是否有將LibSVM格式的多類數據加載到RDD [LabeledPoint] ...?

有在同一個包一個多個方法結合以下描述

荷載標記數據在LIBSVM格式成RDD [LabeledPoint],其中分區的默認號碼。

def loadLibSVMFile(sc: SparkContext, path: String, numFeatures: Int): RDD[LabeledPoint] 

,但是當我試圖用這個,,有錯誤顯示「找到了詮釋,需要布爾」

回答

相關問題