我有一個分類任務。我想用apache spark ml lib SVM算法進行分類。我輸入的是n維的數據。在特徵向量中,某些維度可能會丟失。在apache spark中處理SVM中的缺失值ML Lib
如何處理缺失值?我認爲我錯了將缺失值假設爲零或其他東西。
我有一個分類任務。我想用apache spark ml lib SVM算法進行分類。我輸入的是n維的數據。在特徵向量中,某些維度可能會丟失。在apache spark中處理SVM中的缺失值ML Lib
如何處理缺失值?我認爲我錯了將缺失值假設爲零或其他東西。
沒錯。 ML Lib不會推算缺失值,填充0會扭曲結果。但是,WEKA上有一個ReplaceMissingValues包,可能對您有用;這實現了一種插補算法。 http://weka.sourceforge.net/doc.stable/weka/classifiers/functions/LibSVM.html