我有0％的正確預測，也許是錯誤的設置？

我使用木蘭庫做多標籤分類。我使用的學習者是RAkEL學習者。我跟着木蘭的指令： http://mulan.sourceforge.net/starting.html 我有0％的正確預測，也許是錯誤的設置？

我的標籤xml文件：

<labels xmlns="http://mulan.sourceforge.net/labels"> 
    <label name="1"/> 
    <label name="2"/> 
    <label name="3"/> 
    <label name="4"/> 
    <label name="5"/> 
</labels>

我的訓練數據文件：

@relation predict_label 
@attribute 12345 numeric 
@attribute A numeric 
@attribute B numeric 
@attribute C numeric 
@attribute D numeric 
@attribute E numeric 

@attribute 1 {0, 1} 
@attribute 2 {0, 1} 
@attribute 3 {0, 1} 
@attribute 4 {0, 1} 
@attribute 5 {0, 1} 

@data 
2,3,2,2,2,2,1,0,0,0,0 

2,2,3,2,2,2,0,1,0,0,0 

2,2,2,3,2,2,0,0,1,0,0 

2,2,2,2,3,2,0,0,0,1,0 

2,2,2,2,2,3,0,0,0,0,1

我的測試數據文件：

@relation catalog_ml 
@attribute 12345 numeric 
@attribute A numeric 
@attribute B numeric 
@attribute C numeric 
@attribute D numeric 
@attribute E numeric 

@attribute 1 {0, 1} 
@attribute 2 {0, 1} 
@attribute 3 {0, 1} 
@attribute 4 {0, 1} 
@attribute 5 {0, 1} 

@data 
2,2,2,2,2,3,0,0,0,0,0

結果我執行了預測後：

Bipartion: [false, false, false, false, false] Confidences: [0.0, 0.0, 0.0, 0.0, 0.0] Ranking: [5, 4, 3, 2, 1]Predicted values: null

我的問題是：
1.有人可以幫我驗證我做錯了什麼？
2.據我所知，排名[5,4,3,2,1]是xml標籤文件中標籤的位置。我的理解是否正確？爲什麼排名順序不是從1到5 ...？
3.預測值爲空，因爲這是一個多標籤分類測試嗎？否則哪個學習者不會將預測值返回爲null？

非常感謝。任何建議或意見都比歡迎。

來源

2016-04-21 Xitrum

我對木蘭也很新，但以下我可以說。

有人能幫我確認我做錯了什麼嗎？

你沒有特別做錯事。你只是沒有給分類器足夠的信息來分類你的測試樣本。我加了一些隨機行到你的訓練設置

@relation predict_label 
@attribute 12345 numeric 
@attribute A numeric 
@attribute B numeric 
@attribute C numeric 
@attribute D numeric 
@attribute E numeric 

@attribute 1 {0, 1} 
@attribute 2 {0, 1} 
@attribute 3 {0, 1} 
@attribute 4 {0, 1} 
@attribute 5 {0, 1} 

@data 
2,3,2,2,2,2,1,0,0,0,0 
2,2,3,2,2,2,0,1,0,0,0 
2,2,2,3,2,2,0,0,1,0,0 
2,2,2,2,3,2,0,0,0,1,0 
2,2,2,2,2,3,0,0,0,0,1 
2,2,2,2,2,2,1,0,1,1,0 
1,2,3,4,6,7,0,0,0,1,1 
5,4,3,2,1,0,1,1,1,1,1 
9,8,7,5,4,3,0,1,1,0,0 
1,2,3,2,1,0,0,1,1,1,1 
1,5,6,8,9,0,1,1,0,0,1

，並得到以下結果：

Bipartion: [false, false, false, false, false] Confidences: [0.16666666666666666, 0.0, 0.0, 0.16666666666666666, 0.3333333333333333] Ranking: [3, 5, 4, 2, 1]Predicted values: null

Bipartition是這裏的預測值和信心是一個關於分類如何有信心是關於什麼的，他cassified值這裏。確實不是很有信心。但那是因爲「糟糕的」訓練數據集。

據我所知，排序並[5,4，3，2，1]是在XML標籤文件標籤的位置。我的理解是否正確？爲什麼排名順序不是從1到5 ...？

該排名簡單地顯示了分類器在哪個標籤上最有信心。因爲它們都是「0」，所以它們以某種方式被列爲「隨機」，或者以一種排序功能的方式將其放入信息中。正如你在我的例子中看到的那樣，它是按照信心排序的。

預測值爲null，因爲這是一個多標籤分類測試嗎？否則哪個學習者不會返回預測值爲null？

我其實不知道它們是什麼。如果有人有這個問題的答案，我也會很高興。

編輯

如果複製trainingset線到測試的一個testdataset你不是隻假獲得不同Bipartition值。

來源

2017-01-25 15:32:11

我有0％的正確預測，也許是錯誤的設置？

回答

相關問題