2016-04-21 24 views
0

我使用木蘭庫做多標籤分類。 我使用的學習者是RAkEL學習者。我跟着木蘭的指令: http://mulan.sourceforge.net/starting.html我有0%的正確預測,也許是錯誤的設置?

我的標籤xml文件:

<labels xmlns="http://mulan.sourceforge.net/labels"> 
    <label name="1"/> 
    <label name="2"/> 
    <label name="3"/> 
    <label name="4"/> 
    <label name="5"/> 
</labels> 

我的訓練數據文件:

@relation predict_label 
@attribute 12345 numeric 
@attribute A numeric 
@attribute B numeric 
@attribute C numeric 
@attribute D numeric 
@attribute E numeric 

@attribute 1 {0, 1} 
@attribute 2 {0, 1} 
@attribute 3 {0, 1} 
@attribute 4 {0, 1} 
@attribute 5 {0, 1} 

@data 
2,3,2,2,2,2,1,0,0,0,0 

2,2,3,2,2,2,0,1,0,0,0 

2,2,2,3,2,2,0,0,1,0,0 

2,2,2,2,3,2,0,0,0,1,0 

2,2,2,2,2,3,0,0,0,0,1 

我的測試數據文件:

@relation catalog_ml 
@attribute 12345 numeric 
@attribute A numeric 
@attribute B numeric 
@attribute C numeric 
@attribute D numeric 
@attribute E numeric 

@attribute 1 {0, 1} 
@attribute 2 {0, 1} 
@attribute 3 {0, 1} 
@attribute 4 {0, 1} 
@attribute 5 {0, 1} 

@data 
2,2,2,2,2,3,0,0,0,0,0 

結果我執行了預測後:

Bipartion: [false, false, false, false, false] Confidences: [0.0, 0.0, 0.0, 0.0, 0.0] Ranking: [5, 4, 3, 2, 1]Predicted values: null 

我的問題是:
1.有人可以幫我驗證我做錯了什麼?
2.據我所知,排名[5,4,3,2,1]是xml標籤文件中標籤的位置。我的理解是否正確?爲什麼排名順序不是從1到5 ...?
3.預測值爲空,因爲這是一個多標籤分類測試嗎?否則哪個學習者不會將預測值返回爲null?

非常感謝。任何建議或意見都比歡迎。

回答

0

我對木蘭也很新,但以下我可以說。

  1. 有人能幫我確認我做錯了什麼嗎?

你沒有特別做錯事。你只是沒有給分類器足夠的信息來分類你的測試樣本。我加了一些隨機行到你的訓練設置

@relation predict_label 
@attribute 12345 numeric 
@attribute A numeric 
@attribute B numeric 
@attribute C numeric 
@attribute D numeric 
@attribute E numeric 

@attribute 1 {0, 1} 
@attribute 2 {0, 1} 
@attribute 3 {0, 1} 
@attribute 4 {0, 1} 
@attribute 5 {0, 1} 

@data 
2,3,2,2,2,2,1,0,0,0,0 
2,2,3,2,2,2,0,1,0,0,0 
2,2,2,3,2,2,0,0,1,0,0 
2,2,2,2,3,2,0,0,0,1,0 
2,2,2,2,2,3,0,0,0,0,1 
2,2,2,2,2,2,1,0,1,1,0 
1,2,3,4,6,7,0,0,0,1,1 
5,4,3,2,1,0,1,1,1,1,1 
9,8,7,5,4,3,0,1,1,0,0 
1,2,3,2,1,0,0,1,1,1,1 
1,5,6,8,9,0,1,1,0,0,1 

,並得到以下結果:

Bipartion: [false, false, false, false, false] Confidences: [0.16666666666666666, 0.0, 0.0, 0.16666666666666666, 0.3333333333333333] Ranking: [3, 5, 4, 2, 1]Predicted values: null 

Bipartition是這裏的預測值和信心是一個關於分類如何有信心是關於什麼的,他cassified值這裏。確實不是很有信心。但那是因爲「糟糕的」訓練數據集。

  • 據我所知,排序並[5,4,3,2,1]是在XML標籤文件標籤的位置。我的理解是否正確?爲什麼排名順序不是從1到5 ...?
  • 該排名簡單地顯示了分類器在哪個標籤上最有信心。因爲它們都是「0」,所以它們以某種方式被列爲「隨機」,或者以一種排序功能的方式將其放入信息中。正如你在我的例子中看到的那樣,它是按照信心排序的。

    預測值爲null,因爲這是一個多標籤分類測試嗎?否則哪個學習者不會返回預測值爲null?

    我其實不知道它們是什麼。如果有人有這個問題的答案,我也會很高興。

    編輯

    如果複製trainingset線到測試的一個testdataset你不是隻假獲得不同Bipartition值。

    相關問題