2017-08-01 47 views
0

我有輸入來源的順序。當輸入符合特定的順序時,它被分類到特定的組中。基於此,我建立了如下的培訓文件。基於特徵發生順序的分類

LABEL FEATURE1,FEATURE2,FEATURE3,FEATURE4 
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D 
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D 
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D 
CLASS_A INPUT_A,INPUT_B,INPUT_C,INPUT_D 
CLASS_B INPUT_C,INPUT_D,, 
CLASS_B INPUT_C,INPUT_D,, 
CLASS_B INPUT_C,INPUT_D,, 
CLASS_C INPUT_A,INPUT_B,INPUT_D, 
CLASS_C INPUT_A,INPUT_B,INPUT_D, 
CLASS_C INPUT_A,INPUT_B,INPUT_D, 
CLASS_C INPUT_A,INPUT_B,INPUT_D, 
CLASS_C INPUT_A,INPUT_B,INPUT_D, 
CLASS_D INPUT_E,INPUT_F,, 
CLASS_D INPUT_E,INPUT_F,, 
CLASS_D INPUT_E,INPUT_F,, 
CLASS_D INPUT_E,INPUT_F,, 

我正在嘗試使用決策樹來做分類,但問題是它沒有考慮構建模型時的順序。決策樹是否正確地處理問題,其中特徵順序對於分類而言非常重要,而不是每個特徵的權重,或者是否有更好的算法/方法可用於解決這些類型的問題。

回答

0

決策樹是很好爲此,但它似乎是你選擇的算法在處理輸入時不考慮順序。如果您使用的是預打包算法,則可能會發現編輯輸入文件並使用其順序標記每個功能部件會更容易:將訂單視爲功能值。例如,您輸入的可能是這樣的:

CLASS_A 1 2 3 4 0 0 
CLASS_B 0 0 1 2 0 0 
CLASS_C 1 2 0 3 0 0 
CLASS_D 0 0 0 0 1 2 

這將允許您從各種訓練算法選擇:決策樹,樸素貝葉斯,SVM,甚至K-means聚類。