所以我試圖在spark-shell中實現一個簡單的機器學習代碼,當我試圖給出一個csv文件時,它需要一個libsvm格式,所以我使用phraug庫將我的數據集轉換爲所需的格式。雖然這有效,但我還需要對數據進行標準化,所以我使用Standard Scaler來轉換數據。這也行得通,下一步是培訓機器,爲此我使用了SVMWithSGD模型。但是,當我試圖培養我一直得到錯誤 error: type mis
我試圖用svm-train生成20個模型。該腳本工作並打印交叉驗證值,但不創建模型文件。我無法弄清楚爲什麼,有什麼想法? for i in range(1,21):
format_libsvm(data,"test",i) # create a data file called test
data = "test"
model = "model"+str(i)