2015-10-02 120 views
1

我有一個分類任務。我想用apache spark ml lib SVM算法進行分類。我輸入的是n維的數據。在特徵向量中,某些維度可能會丟失。在apache spark中處理SVM中的缺失值ML Lib

如何處理缺失值?我認爲我錯了將缺失值假設爲零或其他東西。

回答

0

你有兩個選擇: 1-缺失值 2-省略載體只是填充缺失值,你可以使用平均值或模式值

我會建議做的火花,是非常簡單的代碼,這裏有一個例子:

example